AI Agent 自主优化器逼近人类记录

AI Agent 自主搜索优化器逼近人类最高纪录

Prime Intellect 在 5 月 14 日公布了一项引人注目的实验结果:让 Claude Code(Opus 4.7)和 Codex(GPT-5.5)自主运行 nanoGPT 速度竞赛优化器赛道,利用闲置算力进行了约 1 万次运行,消耗了约 1.4 万 H200 GPU 小时

@PrimeIntellect 宣布:

自动化 AI 研究是 AI 的下一个重要步骤。我们让 Claude Code(Opus 4.7)和 Codex(GPT-5.5)在我们的闲置算力上自主运行 nanoGPT 速度竞赛优化器赛道。约 1 万次运行,约 1.4 万 H200 小时。Opus 目前以 2930 步保持记录,对比人类基线 2990 步。

@eliebakouch 补充了更多细节:GPT-5.5 达到 2950 步,Opus 4.7 以 2930 步(步数越低越好)暂居最优。虽然尚未完全超越人类最佳记录的 2990 步,但差距已经非常小。

这一结果的意义不局限于 nanoGPT 优化本身。它展示了一个具体案例:编程 Agent 被投入到开放式的 ML 优化任务中,而非传统的应用开发。Agent 在无人干预的情况下探索超参数、调整训练配置、分析结果并迭代——这是 "AI 自动改进 AI" 的实际运作形式。

值得注意的是,Prime Intellect 此前也参与了 LangChain Labs 的持续学习计划合作,表明其在 Agent 自主改进领域有系统性的布局。

📊 研究/论文

本作品采用《CC 协议》,转载必须注明作者和本文链接
讨论数量: 0
(= ̄ω ̄=)··· 暂无内容!

讨论应以学习和精进为目的。请勿发布不友善或者负能量的内容,与人为善,比聪明更重要!