Gemini 3.5 Flash 与 Google 全栈 Agent 发布 Google I/O 2026 火力全开。Google 一口气发布了 Gemini 3.5 Flash、Gemini Omni、Antigravity 全栈 Agent 平台、Gemini Sp...
Cursor Composer 2.5 发布,10倍算力训新模型 1. Cursor 发布 Composer 2.5,并披露正在从零训练更大模型 5月18日,Cursor 发布了其迄今最强的模型 Composer 2.5,强调在...
TurboQuant 与 MTP:Qwen 本地推理加速实测 本周 r/LocalLLaMA 上最受关注的技术讨论集中在 TurboQuant 和 Multi-Token Prediction(MTP)的性能对比上。社区在两条高互...
ChatGPT 进军个人财务:Pro 用户专属预览 OpenAI 本周为 ChatGPT Pro 用户在美国地区推出了个人财务管理功能预览版,用户可以通过 Plaid 安全连接银行账户,查看消费趋势...
代理评测体系爆发:从 Benchmark 到观测平台 AI 代理正在获得更长的执行周期和更强的工具能力,但评测它们却变得越来越困难。Palash Shah 在推文中直接指出,现代代理评...
优化器复兴:SODA 封装 Muon 击败调参版 Muon 在 Adam 及其变体的 "优化器墓地" 沉寂多年后,训练优化器的创新正在重新升温。Zachary Nado 简洁地总结了当前形势:Slopti...
Anthropic 重置费率上限,Mythos 震撼评测 Anthropic 本周做出了一个让开发者社区振奋的操作:直接重置了所有用户的 5 小时和每周速率限制。Claude Devs 官推简短宣布 "H...
Mitchell Hashimoto 警告:AI 软件工程中的 MTTR 陷阱 HashiCorp 联合创始人 Mitchell Hashimoto 本周发表了一条在 AI 工程师圈引起强烈共鸣的长推文。他警告称,整个行...
Grep 打败向量检索:编码代理搜索新范式 一篇新论文本周在 AI 开发者圈引发热议:研究发现,用 grep 风格的文本搜索包裹在合适的代理宿主层中,在编码代理任务上的表现可...
GitHub Copilot:编码宿主层(Harness)才是壁垒 GitHub Copilot 团队本周发布了一篇幕后技术文章,传递的核心信号非常明确:开发者体验的真正决定因素不是底层模型,而...
Codex 移动端上线:4M 周活、百万下载 OpenAI 的 Codex 移动应用正在成为本轮最受关注的开发者产品事件。据 OpenAI 开发者体验负责人 Vaibhav 透露,自 Codex App 发布以...
Cerebras IPO:声称已为 OpenAI 内部模型提供服务 Cerebras Systems 本周以 IPO 的身份重回舆论中心,投资者和基础设施领域的观察者将这家人工智能芯片公司描绘为一个长...
Zyphra 发布 ZAYA1-8B 扩散语言模型,解码加速 7.7 倍 Zyphra 在 5 月 14 日发布了 ZAYA1-8B-Diffusion-Preview,这是据称首个在 AMD 硬件上训练的扩散语言模型,其核心...
AI Agent 网页搜索遭遇基础设施瓶颈 r/LocalLLaMA 社区本周一篇帖子获得了 838 互动量,讨论了一个被忽视但影响深远的问题:AI Agent 的网页搜索/检索通道正在快速收窄。...
AI Agent 自主搜索优化器逼近人类最高纪录 Prime Intellect 在 5 月 14 日公布了一项引人注目的实验结果:让 Claude Code(Opus 4.7)和 Codex(GPT-5.5)自主运行 nanoG...
社交账号:
我要举报该,理由是: