Karpathy开源“AI研究员”,630行代码让智能体通宵炼模型,一晚可跑100次实验
创始人
2026-03-08 20:37:38

如果你有一块 NVIDIA GPU,睡前启动一个脚本,第二天早上醒来就能收获一百次 LLM 训练实验的结果,其中一部分还确实比你手动调参调得更好,是不是听起来有些难以置信?

但这就是 Andrej Karpathy 今天凌晨开源的新项目 autoresearch 所做的事。项目上线不到几个小时,他在 X(原 Twitter)上的发布帖浏览量突破百万,GitHub 仓库迅速收获超过 2,500 颗星。整个仓库的核心代码只有约 630 行 Python。

图丨相关推文(来源:X)

autoresearch 做的事情,一句话就能说清:把一个简化过的大语言模型训练环境交给 AI 智能体(AI Agent),让它在你睡觉的时候自主跑实验。智能体修改代码,启动训练,五分钟后检查结果,如果验证损失降低了就保留改动,没降低就回退,然后继续下一轮。你早上醒来,面前是一串实验日志,和一个可能变好了的模型。

过去几年里,Karpathy 开源了一系列以极简主义著称的项目:2020 年的 micrograd 和 minGPT,2023 年的 nanoGPT,2024 年用纯 C 和 CUDA 写的 llm.c,2025 年覆盖 LLM 全流程的 nanochat,以及 2026 年 2 月那个仅用 243 行纯 Python、零外部依赖实现 GPT 训练和推理的 microgpt。每一次迭代都在做同一件事,剥除抽象层,把复杂系统压缩到人类可以在一杯咖啡时间里读完的代码量。

autoresearch 延续了这条线索,只是这一次,它不再是给人看的教学工具,而是给 AI 用的实验平台。

整个仓库只有三个核心文件。prepare.py 负责下载训练数据和训练一个 BPE(Byte Pair Encoding,字节对编码)分词器,这个文件是固定的,智能体不能动。

train.py 是约 630 行的训练脚本,包含完整的 GPT 模型定义、优化器(项目使用了 Muon 和 AdamW 的组合)和训练循环,这是智能体唯一可以编辑的文件,模型架构、超参数、批大小、学习率,所有东西都可以改。

program.md 是一个 Markdown 文件,充当给智能体的指令手册,由人类编写和迭代。这里的核心设计哲学是:人类编写指导智能体行为的"元程序",智能体负责编写和修改实际的训练代码。

训练的时间预算被硬性固定为 5 分钟墙钟时间(wall clock time),不管你的硬件配置如何。这个设计选择有两个好处:

第一,不同实验之间的结果可以直接比较,不管智能体把模型改大了还是改小了;第二,autoresearch 会为你的特定硬件找到 5 分钟内能达到的最优配置。代价是不同人在不同 GPU 上得到的结果无法互相对照。评估指标是 val_bpb(validation bits per byte,验证集上的每字节比特数),越低越好,且与词表大小无关,这样即便智能体改变了分词方案,实验结果也能公平对比。

(来源:GitHub)

按照这个节奏,每小时可以跑大约 12 个实验,一整夜大约 100 个实验。Karpathy 在 README 里附了一张图:83 次实验中保留了 15 次改进,验证损失从接近 1.000 逐步下降到 0.975 附近。图上每个点是一次完整的训练运行,绿色点表示被采纳的改动,灰色点是被丢弃的。

你可以看到智能体尝试了各种各样的策略,调整 batch 大小、修改学习率调度、切换激活函数、引入余弦衰减等,有些管用,大多数没用,但整体趋势是持续向下的。

autoresearch 的训练代码来源于 Karpathy 在 2025 年发布的 nanochat 项目的简化版。nanochat 是一个覆盖 LLM 全栈的实验框架,从分词到预训练、微调、评估、推理到聊天界面全部包含在内,设计目标是在 8 块 H100 GPU 组成的单节点上跑完全流程。

据 Karpathy 公布的数据,用 nanochat 训练一个 GPT-2 级别能力的模型大约需要花费 48 美元(约 2 小时的 8×H100 节点),而 2019 年 GPT-2 的训练成本约为 43,000 美元(nanochat GitHub,2025)。autoresearch 把 nanochat 进一步精简到单 GPU 环境,砍掉了分布式训练、复杂配置和多阶段流水线,只留下一个能跑、能改、能比较的最小单元。

智能体在一个 git 分支上工作。每当它找到一个更好的配置,就提交一个 commit。你可以在 git log 里看到完整的实验演化史。这种设计让所有改动都是可审查和可回滚的,同时也构成了一份天然的研究日志。Karpathy 建议使用 Claude Code 或 OpenAI Codex 这类代码智能体来驱动实验循环,并且把所有权限关掉,智能体只需要读写 train.py 和执行训练命令的能力。

不过,这个项目目前只支持 NVIDIA GPU,测试环境是 H100。Karpathy 在 README 中坦承:支持 CPU、MPS(Apple Silicon)或其他平台在技术上完全可行,但会让代码膨胀,而他不确定自己是否愿意在这个方向上投入精力。他更倾向于让社区来做 fork 和适配。

其实 AI 科研系统也并不算新鲜,但 autoresearch 和那些企业级或科研级系统之间有一个重要的区别:它是刻意做小的。Karpathy 没有搭建一个多智能体编排框架,没有设计复杂的通信协议,没有引入什么记忆模块或检索增强生成(Retrieval-Augmented Generation, RAG)管线。他做的事情和过去六年做的事情一样,把一个概念压缩到你能在周末下午读完并跑起来的规模。一块 GPU,一个文件,一个循环。

README 顶部有一段虚构的引言,大意是:将来 AI 研究完全由自主智能体集群在天空中的计算集群上完成,代码库已经经历了 10,205 次迭代,变成了一个超越人类理解的自修改二进制程序,没有人能验证智能体对版本号的说法是否正确。Karpathy 标注的日期是 2026 年 3 月,然后附言:这个项目讲的是这一切是如何开始的。

参考资料:

1. https://x.com/karpathy/status/2030371219518931079

2. https://github.com/karpathy/autoresearch

⚠️
本网站信息内容及素材来源于网络采集或用户发布,如涉及侵权,请及时联系我们,发送链接至2697952338@QQ.COM,我们将第一时间进行核实与删除处理。

相关内容

热门资讯

和讯投顾误导交费有内幕,欺骗股... 和讯投顾误导交费有内幕,欺骗股民缴费炒股导致亏损,现可依法退费! 和讯信息科技有限公司服务费是可以退...
在上海汇正财经交了服务费能退吗... 汇正财经确实是一家正规的财经公司。但这并不能说明他们公司的宣传就符合实际,从案例中不难看出,业务员完...
巨丰投顾会员费多少钱?股民真实... 巨丰投顾会员费多少钱?股民真实经历提醒,别被话术忽悠,费用可退款!  在巨丰投顾交了服务费可以退!教...
汇正16800跟投是真的赚钱吗...   汇正财经确实是一家正规的投顾公司。但这并不能说明他们公司的宣传就符合实际,从案例中不难看出,业务...
被骗!汇正财经是正规公司吗被坑... 被骗!汇正财经是正规公司吗被坑害后如何追回损失?退费指南来了,退费流程公布及注意事项讲述!投资有风险...
高能云智投可以退费吗?高额投顾... 高能云智投可以退费吗?高额投顾费叠加炒股亏损,骗局曝光,均可合规退款!投资有风险,投资需谨慎!针对网...
股多多软件靠谱吗?炒股亏损人为... 股多多软件靠谱吗?炒股亏损人为操控,介入维权,大批股民退款成功!  在天相财富交了服务费可以退!教你...
汇正财经29800元靠谱吗?收... 汇正财经确实是一家正规的财经公司。但这并不能说明他们公司的宣传就符合实际,从案例中不难看出,业务员完...
国诚投顾服务费怎么追回?交费荐... 追损法援寄语:望所有投资者谨慎投资,远离不正规平台,远离所谓的分析师带单,已经不幸陷入的受.害者应在...
和众汇富交的19999元靠谱吗... 和众汇富交的19999元靠谱吗?保本高收益全是话术,股民真实被骗经历全网曝光!  在北京和众汇富交的...
被骗!和汇众富科技是正规的吗老... 被骗!和汇众富科技是正规的吗老年股民维权无门,专业协助快速实现退款成功投资有风险,投资需谨慎!针对网...
汇正580是不是?收服务费承诺...   汇正财经确实是一家正规的投顾公司。但这并不能说明他们公司的宣传就符合实际,从案例中不难看出,业务...
亚商投资股票靠谱吗?荐股服务纯... 亚商投资股票靠谱吗?荐股服务纯收割套路,业务员洗脑交费全程曝光!投资有风险,投资需谨慎!针对网上素未...
上海汇正财经牛人掌股靠谱吗?股... 汇正财经确实是一家正规的财经公司。但这并不能说明他们公司的宣传就符合实际,从案例中不难看出,业务员完...
凯石证券服务费怎么退?白交服务... 凯石证券服务费怎么退?白交服务费还亏钱,股民已找到快速退费渠道!1
爱赢投顾不给退费怎么办?投顾荐... 爱赢投顾不给退费怎么办?投顾荐股骗局揭秘,买入就跌,想退款直接对接!投资有风险,投资需谨慎!针对网上...
上海九方智投真的能赚钱吗?误导... 九方智投涉及虚假宣传,诱导消费导致亏损惨重!九方智投虚假宣传,欺诈消费者亏的血本无归!九方智投收取高...
在杭州高能怎么退还服务费?理性... 在杭州高能怎么退还服务费?理性防范投顾骗局,交26800费用亏损,快速退款!  在杭州高能交了服务费...
上海海能投顾交的服务费可以退吗... 上海海能投顾交的服务费可以退吗?误导性宣传!缴费亏损推脱市场部好!交费荐股套路防不胜防!退费流程我来...
震撼!和汇众富科技服务费怎么追... 震撼!和汇众富科技服务费怎么追回?承诺收益不兑现反被套,老股民教你维权退费!投资有风险,投资需谨慎!...
上海海能投资可靠吗?收服务费承...   海能证券投资顾问怎么样?虚假宣传欺诈消费者荐高位股!股民交费炒股真的很后悔!服务费可以退!
汇阳投资退费?服务费成功追回实... 汇阳投资退费?服务费成功追回实录,股民避坑干货全分享!  在成都汇阳投顾交了服务费可以退!教你怎么退...
利多星服务费能退吗?退款流程详... (欢迎来电或添加:185 0274 8116)咨询了解如何收集证据并追回被骗资金!利多星智投的智慧星...
股掌柜投顾退费?投顾会员暗藏陷... 股掌柜投顾退费?投顾会员暗藏陷阱,吃亏股民全部成功止损!投资有风险,投资需谨慎!针对网上素未谋面的网...
金证智股帮可信吗?理性防范投顾... 金证智股帮可信吗?理性防范投顾骗局,交26800费用亏损,快速退款!  在湖南金证交了服务费可以退!...