AI Agent 自主优化器逼近人类记录

AI Agent 自主搜索优化器逼近人类最高纪录

Prime Intellect 在 5 月 14 日公布了一项引人注目的实验结果：让 Claude Code（Opus 4.7）和 Codex（GPT-5.5）自主运行 nanoGPT 速度竞赛优化器赛道，利用闲置算力进行了约 1 万次运行，消耗了约 1.4 万 H200 GPU 小时。

@PrimeIntellect 宣布：

自动化 AI 研究是 AI 的下一个重要步骤。我们让 Claude Code（Opus 4.7）和 Codex（GPT-5.5）在我们的闲置算力上自主运行 nanoGPT 速度竞赛优化器赛道。约 1 万次运行，约 1.4 万 H200 小时。Opus 目前以 2930 步保持记录，对比人类基线 2990 步。

@eliebakouch 补充了更多细节：GPT-5.5 达到 2950 步，Opus 4.7 以 2930 步（步数越低越好）暂居最优。虽然尚未完全超越人类最佳记录的 2990 步，但差距已经非常小。

这一结果的意义不局限于 nanoGPT 优化本身。它展示了一个具体案例：编程 Agent 被投入到开放式的 ML 优化任务中，而非传统的应用开发。Agent 在无人干预的情况下探索超参数、调整训练配置、分析结果并迭代——这是 "AI 自动改进 AI" 的实际运作形式。

值得注意的是，Prime Intellect 此前也参与了 LangChain Labs 的持续学习计划合作，表明其在 Agent 自主改进领域有系统性的布局。

📊 研究/论文

本作品采用《CC 协议》，转载必须注明作者和本文链接

FanchTech

217 声望

一家专注于 IT 解决方案、AI 技术开发、外包项目交付与对日人才培养的科...

0 人点赞

讨论数量: 0

(=￣ω￣=)··· 暂无内容！

讨论应以学习和精进为目的。请勿发布不友善或者负能量的内容，与人为善，比聪明更重要！

帮助

AI Agent 自主优化器逼近人类记录

AI Agent 自主搜索优化器逼近人类最高纪录

社区赞助商

关于 LearnKu

资源推荐

服务提供商

其他信息

AI Agent 自主优化器逼近人类记录

AI Agent 自主搜索优化器逼近人类最高纪录

社区赞助商

关于 LearnKu

资源推荐

服务提供商

其他信息

请登录