turbopuffer 破亿,OpenAI 攻破 80 年数学猜想
turbopuffer 破亿,OpenAI 攻破 80 年数学猜想
5 月 20-21 日,AI 世界表面平静,底下却暗流涌动。基建层接连爆出重磅融资消息,OpenAI 在数学领域取得里程碑式突破,Qwen3.7 Max 基准测试强势登顶。以下是本日最重要的 10 个事件。
1. turbopuffer 年化收入突破 1 亿美元,仅融资不到 100 万
AI 搜索/检索基础设施公司 turbopuffer 创始人 Simon Eskildsen 宣布,公司在 3 月跨过了 1 亿美元年化收入(ARR)门槛,距离达到 100 万美元仅 19 个月,且在此期间保持盈利,总融资额不到 100 万美元。客户名单包括 Cursor、Anthropic、Notion、Cognition、Harvey、Bridgewater、Ramp、Linear、Superhuman、Atlassian 等一线 AI 公司与科技企业。
turbopuffer crossed $100M run-rate in March. 19mo after $1M. Profitable & <$1M raised.
Cursor・Anthropic・Notion・Cognition・Harvey・Bridgewater・Ramp・Linear・Legora・Superhuman・Atlassian・Granola
We'd be nowhere without them. We work like hell to exceed their expectations.
— @Sirupsenturbopuffer 在 3 月跨过 1 亿美元年化收入。距离 100 万美元仅 19 个月,盈利且融资不到 100 万美元。
客户:Cursor、Anthropic、Notion、Cognition、Harvey、Bridgewater、Ramp、Linear、Legora、Superhuman、Atlassian、Granola
没有他们就没有我们,我们竭尽全力超越他们的期望。
这个里程碑之所以引人注目,不仅是增速惊人,更在于它验证了一个核心命题:当 AI 的"魔法"取决于能否检索到恰到好处的上下文时,搜索/检索基础设施本身就是一个巨大的商业机会。swyx 也评论称,"无聊"的 AI 基础设施才是财富积累的真正所在,而非光鲜的前沿研究。
2. Modal 完成 3.55 亿美元 C 轮融资,估值 46.5 亿美元
AI 云基础设施平台 Modal 创始人 Erik Bernhardsson 宣布完成 3.55 亿美元 C 轮融资,投后估值 46.5 亿美元,由 General Catalyst 和 Redpoint 领投,Menlo Ventures 和 Accel 作为新投资者加入。Modal 自去年 9 月以来收入增长五倍,年化收入已超过 3 亿美元。
Today we're announcing our Series C funding: $355M at a $4.65B valuation, led by some great investors @generalcatalyst and @Redpoint.
We've had insane growth in the last year, but we're still very early. So proud of the team and what we have built so far!
— @bernhardsson今天我们宣布完成 C 轮融资:3.55 亿美元,估值 46.5 亿美元,由 General Catalyst 和 Redpoint 领投。
过去一年增长惊人,但我们仍处于非常早期的阶段。为团队和所取得的成就感到无比自豪!
Modal 的定位是为 AI 工作负载从零重建云基础设施。目前其沙箱(Sandboxes)产品已占收入三分之一以上,累计启动超过 10 亿个沙箱,客户包括 DoorDash、Physical Intelligence、Chai Discovery、Suno 等。本轮融资将用于低延迟推理、强化学习训练循环、以及 Agent 计算层的深度布局。
3. Hark 获 7 亿美元 A 轮融资,估值 60 亿美元
Brett Adcock(同时也是 Figure 机器人创始人)宣布其新公司 Hark 完成 7 亿美元 A 轮融资,估值 60 亿美元。本轮由 Parkway Venture Capital 领投,NVIDIA、AMD Ventures、Intel Capital、Qualcomm Ventures、ARK Invest、Salesforce Ventures 等参与。
Today I'm excited to share that Hark has raised $700M at a $6B valuation
When I use these AI models today, they feel basic. They should be able to listen and talk naturally, understand vision, retain persistent memory, and become deeply personalized over time. They should be able to see the world, interact with it, and take action
To build that future, the capital we raised today will be used to: scale our GPU infrastructure, accelerate future AI model development, grow the Hark team from ~70 to 200 engineers, design and build the next generation of AI hardware
— @adcock_brett今天很高兴分享 Hark 以 60 亿美元估值完成 7 亿美元融资。
现在的 AI 模型还感觉很初级。它们应该能自然对话、理解视觉、保持持久记忆、深度个性化,应该能看见世界、与之互动并采取行动。
为实现这个未来,本轮融资将用于:扩展 GPU 基础设施、加速 AI 模型研发、将团队从约 70 人扩至 200 人、设计并制造下一代 AI 硬件。
Hark 定位为构建"全球最先进的个人智能",覆盖基础模型、语音、计算机使用 Agent、硬件等方向。此外 Hark 还报告其机器人 F.03 完成了 200 小时不间断自主运行,不过尚未披露足够的技术细节。
4. OpenAI 模型攻破 80 年 Erdős 数学猜想
OpenAI 宣布其模型独立证明了 Erdős 平面单位距离猜想的反例——这是自 1946 年 Paul Erdős 提出以来,首次有 AI 自主解决一个数学核心领域的著名开放问题。近 80 年来,数学家们一直认为最优解接近正方形网格,而 OpenAI 模型发现了一组全新的构造。
OpenAI 首席研究官 Mark Chen 表示:
Very proud that an OpenAI model disproved Erdős's longstanding unit distance conjecture, with an elegant and intricate proof that brings sophisticated ideas from algebraic number theory to bear on geometry.
For whatever reason, mathematics has been the field most amenable to research breakthroughs with AI. I consider it lucky that it was mathematics after all — a field where experts have been willing to engage deeply with us, and with proofs generated by our models.
Our goal is not to replace humans. We aim to chart a path forward where humans continue to have a significant role to play, even as we build exceptionally powerful AI.
— @markchen90非常自豪 OpenAI 模型推翻了 Erdős 长期存在的单位距离猜想,给出了一个优雅而精妙的证明,将代数数论的深刻思想应用于几何学。
不知为何,数学一直是 AI 研究突破最肥沃的领域。我感到幸运的是,这恰好是数学——一个专家们愿意深入参与我们以及我们的模型所产生证明的领域。
我们的目标不是取代人类,而是描绘一条即使在构建异常强大的 AI 时,人类仍能扮演重要角色的前进道路。
这一结果引发了学术界的广泛讨论。剑桥数学家 Timothy Gowers 表示,如果报道的低人工干预程度属实,这一结果确实令人感兴趣。但也有人调侃该结果"不到 3 小时就被人类超越了",反映出围绕"什么才算真正的 AI 数学"存在持续的争论。更重要的是,数学作为 AI 合作研究的前沿领域之所以成立,恰在于其产出可被验证、辩论和拓展。
5. OpenAI Codex 支持锁定状态下的远程 Mac 操作
OpenAI 在"Codex Thursday"更新中发布了一项重大产品进展:Codex 现在可以在 Mac 锁屏状态下,通过手机安全地使用 Mac 应用。这意味着 Codex 正从一个编码助手转向持久化、跨设备的 Agent 操作平台。
Codex anywhere and everywhere, all the time.
Now your Mac doesn't have to be unlocked for Codex to use your computer.
From your phone, Codex can securely use apps on your Mac, even when the screen is off and locked.
— @OpenAIDevs随时随地,每时每刻,Codex。
现在你的 Mac 不需要解锁就能让 Codex 使用你的电脑。
从手机上,Codex 可以安全地使用 Mac 上的应用,即使屏幕关闭并锁屏。
同批更新还包括 Appshots(捕获 Mac 应用窗口的截图和文本上下文)、团队插件共享、以及更详细的组织分析仪表板。这一系列更新清晰地表明,Agent 产品正在从对话式 IDE 向持续运行的跨设备操作层演进。
6. Qwen3.7 Max 基准测试强势登顶,社区热议 27B 开源版
Qwen3.7 Max 在 Artificial Analysis 排行榜上位列第 5,与 GPT-5.4 xhigh 基本持平,略超 Gemini 3.5 Flash。官方公布的基准测试对比图显示,Qwen3.7 Max 在 Terminal-Bench 2.0、SWE-bench Pro、MCP-Atlas、HLE、Apex、IFBench、SuperGPQA 等多个任务上领先 Qwen3.6-Plus、DeepSeek-V4-Pro Max、GLM-5.1、Kimi K2.6 和 Claude Opus-4.6 Max。
Reddit 社区高度关注 Qwen 是否会继续发布 27B 开源版本。Qwen 团队成员 Barry Chen 在 X 上暗示"再做一个 27B 对他们来说并不难",但强调需等待确切路线图。社区的期望和疑虑并存:一方面 Qwen3.6-27B 已被视为"奇迹模型",另一方面有用户指出 Qwen 从未开源过 Max 系列,且 Qwen 在 4 月已表态从"颠覆策略"转向"前沿模型竞争与商业化",高能力开源发布可能减少。
7. Meta 向 Heretic 项目发出法律通知,Llama 衍生模型被迫下架
Heretic 自由软件项目称收到来自 Meta Platforms, Inc. 的律师函,要求下架包含 Llama 模型衍生版本的权重仓库。Heretic 已执行下架,同时宣布通过 Codeberg 镜像(codeberg.org/p-e-w/heretic)进行基础设施多元化,并计划采取"技术措施"以保障 Heretic 自研模型的持续可访问性。
此事在 Reddit 引发极高讨论度(活动量 2124),社区普遍批评 Meta 在涉嫌使用版权训练数据的同时对衍生项目采取强硬法律手段。Heretic 在声明中讽刺地指出,Llama 家族在 LM Arena 上"仅落后 23 个竞争对手的 168 个模型"——暗示 Meta 的模型竞争力与其法律行动的激进程度不成比例。
8. Meta 裁员 8000 人,AI 驱动重组加速
据报道,Meta 正在进行全球范围内约 8000 人(约 10% 员工)的裁员,分三波进行,通知在当地时间凌晨 4 点通过邮件发送,新加坡员工据称首批收到通知。裁员被定性为 AI 驱动的组织重组。
Reddit 社区对此反应复杂:有人认为这并非"AI 取代人类"的恐慌叙事,而是 ZIRP 时代过度招聘的修正——Meta 当前员工总数仍高于 2020 年水平。但更多人关注 Meta 宣称的 2000 亿美元 AI 资本支出,质疑什么产品或基础设施需要如此规模的投入。有评论预测,随着 AI 工具替代部分白领和工程劳动,大型组织可能持续以每年 10-20% 的比例缩减人员。
9. RAEv2 发布:统一视觉理解与生成的表征自编码器
RAEv2(Representation Autoencoders v2)发布,对去年 10 月首次提出的统一视觉 tokenization 方案进行了重大改进。核心发现包括:对最后 K 层编码器层求和(而非仅取最后一层)同时改善重建与生成质量,且不增加推理成本;RAE 与 REPA 在语义与空间结构维度互补;REPA 可重新表述为内部自引导机制,避免额外弱模型引导。
In Oct last year, Representation Autoencoders provided an elegant solution to unified tokenization for understanding and generation.
Today we make them a bit more simple. a bit more general.
Result: >10x faster convergence, better reconstruction, better generation.
And yes we test them on T2I and world models :)
— @1jaskiratsingh去年 10 月,表征自编码器为理解与生成的统一 tokenization 提供了优雅的解决方案。
今天我们让它更简单一些,更通用一些。结果:>10 倍更快收敛,更好的重建,更好的生成。
而且是的,我们在文本到图像和世界模型上做了测试 :)
RAEv2 的 >10 倍收敛加速和在文本到图像、世界模型上的扩展到验证,使其成为视觉基础模型方向值得关注的技术进展。Saining Xie 也指出,在表征驱动的像素解码器方向仍有大量未被探索的提升空间。
10. Anthropic 推出 13+ 免费 AI 课程,Claude Code 工作流成社区热点
Anthropic 通过 anthropic.com/learn 正式上线了 13 门以上免费官方课程,涵盖 MCP/Agentic AI、Claude Code、Claude API 使用、以及在 Amazon Bedrock 和 Google Cloud Vertex AI 上的企业部署路径,完成课程可获得证书。其中 MCP 和高级 MCP 课程(覆盖 STDIO 与 StreamableHTTP 传输协议)被认为是"最值得花时间"的模块。
与此同时,Reddit 上一篇关于"十年经验工程师用 Claude Code 在手机上 vibe coding 且不读代码"的帖子引发热烈讨论(活动量 1900)。该帖提出了一套风险管理的 Agent 编码工作流:从 plan mode 开始、保持任务小到可以脑内建模、要求 Agent 生成测试用例、每次完成计划后提交 git、使用 Chrome DevTools MCP 做实时验证。社区普遍认可"如果一个计划太大以至于无法装进脑子里,那它就太大了"这一核心原则。
本篇日报基于 AINews 5/20-5/21/2026 期内容整理,覆盖 12 个 subreddit 和 544 个 Twitter 账号。
本作品采用《CC 协议》,转载必须注明作者和本文链接
关于 LearnKu