Gemini 3.5 Flash 与 Google 全栈 Agent 发布

AI摘要
这是一篇关于Google I/O 2026大会的技术资讯总结。文章详细介绍了Google发布的多个重大产品更新,包括Gemini 3.5 Flash模型、Gemini Omni多模态生成模型、Antigravity全栈Agent平台、24/7个人AI助手Gemini Spark,以及搜索功能的Agent化。文章还提及了相关定价、第三方基准测试结果、行业合作(如SynthID)以及Andrej Karpathy加入Anthropic的行业动态。内容属于【知识分享】。

Gemini 3.5 Flash 与 Google 全栈 Agent 发布

Google I/O 2026 火力全开。Google 一口气发布了 Gemini 3.5 Flash、Gemini Omni、Antigravity 全栈 Agent 平台、Gemini Spark 24/7 个人 Agent,以及将搜索全面 Agent 化。Google 称其月 token 处理量已从一年前的 480 万亿飙升至 3200 万亿(7x 增长),Gemini 月活用户超 9 亿,覆盖 230+ 国家与 70+ 语言。这一天真正定义了 Google 从聊天助手向 Agent 执行平台的彻底转身。


1. Gemini 3.5 Flash 发布:定位最强 Agent 与编程模型

Google DeepMind 将 Gemini 3.5 Flash 定位为「目前最强的 Agent 与编程模型」,而非绝对旗舰智能模型。它主打高速、高吞吐、深度产品集成,即日 GA,覆盖 Gemini App、Search AI Mode、Gemini API、AI Studio、Antigravity、Android Studio 及企业全表面。

Meet Gemini 3.5 Flash — our strongest agentic and coding model yet.

It delivers frontier-level performance at 4x the speed of comparable frontier models — often at less than half the cost.

Generally available, starting today. 🧵
— @Google

发布 Gemini 3.5 Flash——我们迄今最强的 Agent 与编程模型。以 4 倍于同类前沿模型的速度提供前沿级性能,成本通常不到一半。今日起正式 GA。

核心规格:100 万 token 上下文6.5 万最大输出、四档思考级别(minimal/low/medium 新默认/high)、跨轮次「思维保留」、支持文本 / 图像 / 视频 / 语音输入、仅文本输出。定价 $1.50 / $9.00 每百万输入/输出 token,缓存输入享 90% 折扣。

Google 官方基准:Terminal-Bench 2.1 达 76.2%,GDPval-AA Elo 1656,MCP Atlas 83.6%。Jeff Dean 称在 Antigravity 内部可「快达 12 倍」。


2. Gemini Omni:从任意输入生成任意内容,从视频开始

Google DeepMind 推出 Gemini Omni,将 Gemini 的推理与世界知识与其生成式媒体系统融合,首发能力是视频生成与编辑。支持文本/图像/音频/视频输入,强调跨轮次角色一致性、物理合理性和场景记忆。

We're dropping Gemini Omni: our first step towards a model that can create anything from anything - starting with video.

It combines Gemini's intelligence with our generative media systems - representing a leap forward in world understanding, multimodality, and editing 🧵
— @GoogleDeepMind

我们推出 Gemini Omni:迈向「从任意输入生成任意内容」模型的第一步——从视频开始。它融合了 Gemini 的智能与我们的生成媒体系统,标志着世界理解、多模态与编辑能力的飞跃。

Gemini Omni Flash 现已对付费 Gemini 用户开放(Gemini App 与 Flow),YouTube Shorts/Create 本周起免费推出,API 将在数周内面向开发者。多位观察者将 Omni 解读为 Google 投资「世界模型」的信号,而非单纯的文本/代码竞赛延伸。


3. Antigravity:从 Coding Assistant 到 Agent 执行操作系统

Antigravity 是本次 I/O 最被低估的主题:Google 不再将 Agent 视为聊天模型的薄封装,而是将其打造为执行底层。

We're expanding Google @Antigravity's agentic surfaces and features — and they're all available now for you to try.

🔹 Antigravity CLI
🔹 Antigravity SDK
🔹 Native voice support with Gemini Audio models
🔹 @Antigravity 2.0 desktop application
🔹 Integrations with @GoogleAIStudio, @Android, @Firebase, and the web
— @Google

我们正在扩展 Antigravity 的 Agent 界面与功能——全部现已可用。Antigravity CLI、SDK、Gemini Audio 原生语音、Antigravity 2.0 桌面应用,以及与 AI Studio、Android、Firebase 和 Web 的集成。

发布内容包括:Antigravity 2.0 桌面应用(Agent-first 设计)、CLI、SDK、Managed Agents API(单次 API 调用获得 Agent + 托管 Linux 沙盒,支持 Bash/Python/Node/文件/浏览/GCS 挂载)、AI Studio 一键导出至 Antigravity、Android 原生 App 生成。这是 Google 对 Codex/Claude Code 等工具的有力回击,且基础设施故事更强。


4. Gemini Spark:24/7 个人 AI Agent,跑在云端

Google 推出 Gemini Spark——运行在 Google Cloud 专有虚拟机上的 24/7 个人 Agent。它可以在用户设备关闭时继续执行长任务,在执行重大操作前主动征求用户确认,整合 Google 工具,并计划通过 MCP 支持第三方。

Introducing Gemini Spark ✨

It's your 24/7 personal AI agent that helps you navigate your digital life, taking action on your behalf, and under your direction.

🧠 It runs on Gemini 3.5 and is built on @Antigravity, so it can perform long-running tasks easily in the background.

⏱️ And because it runs on dedicated virtual machines on Google Cloud, you don't even need to keep your laptop open.

🧰 Spark will integrate seamlessly with Google tools, and soon with third parties through MCP.
— @Google

推出 Gemini Spark ✨,你的 24/7 个人 AI Agent。基于 Gemini 3.5 和 Antigravity,在 Google Cloud 专有 VM 上运行,无需保持设备开机。无缝整合 Google 工具,即将通过 MCP 支持第三方。

Spark 配合 macOS 桌面应用、Gemini Live 即时语音和 Daily Brief 个性化摘要,构成了 Google 消费端 Agent 需求的完整拼图。


5. 搜索 Agent 化:持续监控 + 动态生成 UI

Google 预览了搜索中最激进的消费者级动作:信息 Agent 可对网络/新闻/社媒/实时信号进行持久监控,主动推送合成后的更新与行动建议,今年夏季推送给 Pro/Ultra 用户。同时搜索还将利用 Antigravity + Gemini 3.5 Flash 实时生成自定义可视化工具与模拟器——搜索从检索/排序转向「后台监控 + 生成式小程序」的模式转变。


6. 12 小时构建操作系统:93 个并行子 Agent 示范

Google 用一场工程演示展示了 Antigravity 的真正野心:12 小时内使用 93 个并行子 Agent1.5 万+ 次模型请求26 亿 token不到 $1000 的 API 额度,从零构建了一个可运行操作系统的完整版本。即便这主要是精心设计的 Demo,它所揭示的架构方向——大量快速 Agent 协同取代单一缓慢的 monolithic 推理——正是 Google 希望开发者采用的范式。


7. Andrej Karpathy 加入 Anthropic

当天最轰动的非 Google 新闻:Andrej Karpathy 宣布加入 Anthropic。

Personal update: I've joined Anthropic. I think the next few years at the frontier of LLMs will be especially formative. I am very excited to join the team here and get back to R&D. I remain deeply passionate about education and plan to resume my work on it in time.
— @karpathy

个人更新:我已加入 Anthropic。我认为 LLM 前沿领域的未来几年将格外关键。很高兴加入团队重新投入研发。我仍然对教育充满热情,计划将来恢复相关工作。

该推文获近 12 万点赞9000+ 转发。Axios 后续报道称 Karpathy 将从事 RSI/自研方向并启动新的预训练项目。社区普遍将此解读为 Anthropic 的重大人才胜利。


8. Artificial Analysis 第三方基准:Pareto 前沿领先但成本暴涨

Artificial Analysis 获得预发布访问权限后的全面评测揭示了更复杂的图景:

Google's new Gemini 3.5 Flash is the clear leader on the Intelligence vs Speed Pareto frontier and makes large gains on GDPval-AA (real-world agentic tasks), but is 5x the cost of Gemini 3 Flash
— @ArtificialAnlys

Google 的新 Gemini 3.5 Flash 在智能-速度 Pareto 前沿上明显领先,在 GDPval-AA(真实世界 Agent 任务)上大幅进步,但成本是 Gemini 3 Flash 的 5 倍。

关键数据:Intelligence Index 55(+9 vs Gemini 3 Flash),幻觉率降至 61%(-31 个百分点),MMMU-Pro 84%(该平台最高记录),GDPval-AA Elo 1656(接近 GPT-5.4 xhigh 的 1674),推理速度 >280 token/s。但运行整个评测套件的成本比 Gemini 3 Flash 贵 5.5 倍,比 Gemini 3.1 Pro 贵 75%。"Flash" 的定价标签正在远离「廉价」含义。


9. SynthID 合作:Google 联手 OpenAI、NVIDIA、ElevenLabs

Google 在 I/O 上宣布将 SynthID 水印技术推广至 Search、Gemini、Chrome 及硬件/媒体全表面,更重要的是与 OpenAI、NVIDIA、Kakao 和 ElevenLabs 达成合作,将 SynthID 引入其生成内容。OpenAI 当天同步宣布支持通过 SynthID 水印 + C2PA 凭证检验 OpenAI 生成图像。这比 Omni 或 3.5 Flash 更低调,但如果内容溯源成为强监管基础设施,其耐久性可能远胜于模型发布。


10. OpenAI 推出「保障容量」:1-3 年锁定计算资源

OpenAI 发布了 Guaranteed Capacity 商业产品,允许客户以 1-3 年承诺锁定长期推理算力,享受折扣 token 价格。Sam Altman 将其表述为对「模型越有用,世界越算力受限」这一现实的回应。这是 AI 基础设施从按需调用向企业级预留实例转变的又一信号。


定价与订阅

Google 同步调整了订阅阶梯:新增 $100/月 档位,顶级 Ultra 从 $250 降至 $200/月,对重度编码与创作者用户更具攻击性的定价信号。


本期新闻覆盖 2026/5/18-5/19,来源包括 12 个 subreddit、544 个 Twitter 账号,原始出处:AINews / Latent Space

本作品采用《CC 协议》,转载必须注明作者和本文链接
讨论数量: 0
(= ̄ω ̄=)··· 暂无内容!

讨论应以学习和精进为目的。请勿发布不友善或者负能量的内容,与人为善,比聪明更重要!