AI Agent 自主优化器逼近人类记录
AI Agent 自主搜索优化器逼近人类最高纪录
Prime Intellect 在 5 月 14 日公布了一项引人注目的实验结果:让 Claude Code(Opus 4.7)和 Codex(GPT-5.5)自主运行 nanoGPT 速度竞赛优化器赛道,利用闲置算力进行了约 1 万次运行,消耗了约 1.4 万 H200 GPU 小时。
@PrimeIntellect 宣布:
自动化 AI 研究是 AI 的下一个重要步骤。我们让 Claude Code(Opus 4.7)和 Codex(GPT-5.5)在我们的闲置算力上自主运行 nanoGPT 速度竞赛优化器赛道。约 1 万次运行,约 1.4 万 H200 小时。Opus 目前以 2930 步保持记录,对比人类基线 2990 步。
@eliebakouch 补充了更多细节:GPT-5.5 达到 2950 步,Opus 4.7 以 2930 步(步数越低越好)暂居最优。虽然尚未完全超越人类最佳记录的 2990 步,但差距已经非常小。
这一结果的意义不局限于 nanoGPT 优化本身。它展示了一个具体案例:编程 Agent 被投入到开放式的 ML 优化任务中,而非传统的应用开发。Agent 在无人干预的情况下探索超参数、调整训练配置、分析结果并迭代——这是 "AI 自动改进 AI" 的实际运作形式。
值得注意的是,Prime Intellect 此前也参与了 LangChain Labs 的持续学习计划合作,表明其在 Agent 自主改进领域有系统性的布局。
📊 研究/论文
本作品采用《CC 协议》,转载必须注明作者和本文链接
关于 LearnKu