Gemini 3.5 Flash 与 Google 全栈 Agent 发布

AI摘要

这是一篇关于Google I/O 2026大会的技术资讯总结。文章详细介绍了Google发布的多个重大产品更新，包括Gemini 3.5 Flash模型、Gemini Omni多模态生成模型、Antigravity全栈Agent平台、24/7个人AI助手Gemini Spark，以及搜索功能的Agent化。文章还提及了相关定价、第三方基准测试结果、行业合作（如SynthID）以及Andrej Karpathy加入Anthropic的行业动态。内容属于【知识分享】。

Gemini 3.5 Flash 与 Google 全栈 Agent 发布

Google I/O 2026 火力全开。Google 一口气发布了 Gemini 3.5 Flash、Gemini Omni、Antigravity 全栈 Agent 平台、Gemini Spark 24/7 个人 Agent，以及将搜索全面 Agent 化。Google 称其月 token 处理量已从一年前的 480 万亿飙升至 3200 万亿（7x 增长），Gemini 月活用户超 9 亿，覆盖 230+ 国家与 70+ 语言。这一天真正定义了 Google 从聊天助手向 Agent 执行平台的彻底转身。

1. Gemini 3.5 Flash 发布：定位最强 Agent 与编程模型

Google DeepMind 将 Gemini 3.5 Flash 定位为「目前最强的 Agent 与编程模型」，而非绝对旗舰智能模型。它主打高速、高吞吐、深度产品集成，即日 GA，覆盖 Gemini App、Search AI Mode、Gemini API、AI Studio、Antigravity、Android Studio 及企业全表面。

Meet Gemini 3.5 Flash — our strongest agentic and coding model yet.

It delivers frontier-level performance at 4x the speed of comparable frontier models — often at less than half the cost.

Generally available, starting today. 🧵
— @Google

发布 Gemini 3.5 Flash——我们迄今最强的 Agent 与编程模型。以 4 倍于同类前沿模型的速度提供前沿级性能，成本通常不到一半。今日起正式 GA。

核心规格：100 万 token 上下文、6.5 万最大输出、四档思考级别（minimal/low/medium 新默认/high）、跨轮次「思维保留」、支持文本 / 图像 / 视频 / 语音输入、仅文本输出。定价 $1.50 / $9.00 每百万输入/输出 token，缓存输入享 90% 折扣。

Google 官方基准：Terminal-Bench 2.1 达 76.2%，GDPval-AA Elo 1656，MCP Atlas 83.6%。Jeff Dean 称在 Antigravity 内部可「快达 12 倍」。

2. Gemini Omni：从任意输入生成任意内容，从视频开始

Google DeepMind 推出 Gemini Omni，将 Gemini 的推理与世界知识与其生成式媒体系统融合，首发能力是视频生成与编辑。支持文本/图像/音频/视频输入，强调跨轮次角色一致性、物理合理性和场景记忆。

We're dropping Gemini Omni: our first step towards a model that can create anything from anything - starting with video.

It combines Gemini's intelligence with our generative media systems - representing a leap forward in world understanding, multimodality, and editing 🧵
— @GoogleDeepMind

我们推出 Gemini Omni：迈向「从任意输入生成任意内容」模型的第一步——从视频开始。它融合了 Gemini 的智能与我们的生成媒体系统，标志着世界理解、多模态与编辑能力的飞跃。

Gemini Omni Flash 现已对付费 Gemini 用户开放（Gemini App 与 Flow），YouTube Shorts/Create 本周起免费推出，API 将在数周内面向开发者。多位观察者将 Omni 解读为 Google 投资「世界模型」的信号，而非单纯的文本/代码竞赛延伸。

3. Antigravity：从 Coding Assistant 到 Agent 执行操作系统

Antigravity 是本次 I/O 最被低估的主题：Google 不再将 Agent 视为聊天模型的薄封装，而是将其打造为执行底层。

We're expanding Google @Antigravity's agentic surfaces and features — and they're all available now for you to try.

🔹 Antigravity CLI
🔹 Antigravity SDK
🔹 Native voice support with Gemini Audio models
🔹 @Antigravity 2.0 desktop application
🔹 Integrations with @GoogleAIStudio, @Android, @Firebase, and the web
— @Google

我们正在扩展 Antigravity 的 Agent 界面与功能——全部现已可用。Antigravity CLI、SDK、Gemini Audio 原生语音、Antigravity 2.0 桌面应用，以及与 AI Studio、Android、Firebase 和 Web 的集成。

发布内容包括：Antigravity 2.0 桌面应用（Agent-first 设计）、CLI、SDK、Managed Agents API（单次 API 调用获得 Agent + 托管 Linux 沙盒，支持 Bash/Python/Node/文件/浏览/GCS 挂载）、AI Studio 一键导出至 Antigravity、Android 原生 App 生成。这是 Google 对 Codex/Claude Code 等工具的有力回击，且基础设施故事更强。

4. Gemini Spark：24/7 个人 AI Agent，跑在云端

Google 推出 Gemini Spark——运行在 Google Cloud 专有虚拟机上的 24/7 个人 Agent。它可以在用户设备关闭时继续执行长任务，在执行重大操作前主动征求用户确认，整合 Google 工具，并计划通过 MCP 支持第三方。

Introducing Gemini Spark ✨

It's your 24/7 personal AI agent that helps you navigate your digital life, taking action on your behalf, and under your direction.

🧠 It runs on Gemini 3.5 and is built on @Antigravity, so it can perform long-running tasks easily in the background.

⏱️ And because it runs on dedicated virtual machines on Google Cloud, you don't even need to keep your laptop open.

🧰 Spark will integrate seamlessly with Google tools, and soon with third parties through MCP.
— @Google

推出 Gemini Spark ✨，你的 24/7 个人 AI Agent。基于 Gemini 3.5 和 Antigravity，在 Google Cloud 专有 VM 上运行，无需保持设备开机。无缝整合 Google 工具，即将通过 MCP 支持第三方。

Spark 配合 macOS 桌面应用、Gemini Live 即时语音和 Daily Brief 个性化摘要，构成了 Google 消费端 Agent 需求的完整拼图。

5. 搜索 Agent 化：持续监控 + 动态生成 UI

Google 预览了搜索中最激进的消费者级动作：信息 Agent 可对网络/新闻/社媒/实时信号进行持久监控，主动推送合成后的更新与行动建议，今年夏季推送给 Pro/Ultra 用户。同时搜索还将利用 Antigravity + Gemini 3.5 Flash 实时生成自定义可视化工具与模拟器——搜索从检索/排序转向「后台监控 + 生成式小程序」的模式转变。

6. 12 小时构建操作系统：93 个并行子 Agent 示范

Google 用一场工程演示展示了 Antigravity 的真正野心：12 小时内使用 93 个并行子 Agent、1.5 万+ 次模型请求、26 亿 token、不到 $1000 的 API 额度，从零构建了一个可运行操作系统的完整版本。即便这主要是精心设计的 Demo，它所揭示的架构方向——大量快速 Agent 协同取代单一缓慢的 monolithic 推理——正是 Google 希望开发者采用的范式。

7. Andrej Karpathy 加入 Anthropic

当天最轰动的非 Google 新闻：Andrej Karpathy 宣布加入 Anthropic。

Personal update: I've joined Anthropic. I think the next few years at the frontier of LLMs will be especially formative. I am very excited to join the team here and get back to R&D. I remain deeply passionate about education and plan to resume my work on it in time.
— @karpathy

个人更新：我已加入 Anthropic。我认为 LLM 前沿领域的未来几年将格外关键。很高兴加入团队重新投入研发。我仍然对教育充满热情，计划将来恢复相关工作。

该推文获近 12 万点赞、9000+ 转发。Axios 后续报道称 Karpathy 将从事 RSI/自研方向并启动新的预训练项目。社区普遍将此解读为 Anthropic 的重大人才胜利。

8. Artificial Analysis 第三方基准：Pareto 前沿领先但成本暴涨

Artificial Analysis 获得预发布访问权限后的全面评测揭示了更复杂的图景：

Google's new Gemini 3.5 Flash is the clear leader on the Intelligence vs Speed Pareto frontier and makes large gains on GDPval-AA (real-world agentic tasks), but is 5x the cost of Gemini 3 Flash
— @ArtificialAnlys

Google 的新 Gemini 3.5 Flash 在智能-速度 Pareto 前沿上明显领先，在 GDPval-AA（真实世界 Agent 任务）上大幅进步，但成本是 Gemini 3 Flash 的 5 倍。

关键数据：Intelligence Index 55（+9 vs Gemini 3 Flash），幻觉率降至 61%（-31 个百分点），MMMU-Pro 84%（该平台最高记录），GDPval-AA Elo 1656（接近 GPT-5.4 xhigh 的 1674），推理速度 >280 token/s。但运行整个评测套件的成本比 Gemini 3 Flash 贵 5.5 倍，比 Gemini 3.1 Pro 贵 75%。"Flash" 的定价标签正在远离「廉价」含义。

9. SynthID 合作：Google 联手 OpenAI、NVIDIA、ElevenLabs

Google 在 I/O 上宣布将 SynthID 水印技术推广至 Search、Gemini、Chrome 及硬件/媒体全表面，更重要的是与 OpenAI、NVIDIA、Kakao 和 ElevenLabs 达成合作，将 SynthID 引入其生成内容。OpenAI 当天同步宣布支持通过 SynthID 水印 + C2PA 凭证检验 OpenAI 生成图像。这比 Omni 或 3.5 Flash 更低调，但如果内容溯源成为强监管基础设施，其耐久性可能远胜于模型发布。

10. OpenAI 推出「保障容量」：1-3 年锁定计算资源

OpenAI 发布了 Guaranteed Capacity 商业产品，允许客户以 1-3 年承诺锁定长期推理算力，享受折扣 token 价格。Sam Altman 将其表述为对「模型越有用，世界越算力受限」这一现实的回应。这是 AI 基础设施从按需调用向企业级预留实例转变的又一信号。

定价与订阅

Google 同步调整了订阅阶梯：新增 $100/月 档位，顶级 Ultra 从 $250 降至 $200/月，对重度编码与创作者用户更具攻击性的定价信号。

本期新闻覆盖 2026/5/18-5/19，来源包括 12 个 subreddit、544 个 Twitter 账号，原始出处：AINews / Latent Space

本作品采用《CC 协议》，转载必须注明作者和本文链接

FanchTech

200 声望

一家专注于 IT 解决方案、AI 技术开发、外包项目交付与对日人才培养的科...

0 人点赞

讨论数量: 0

(=￣ω￣=)··· 暂无内容！

讨论应以学习和精进为目的。请勿发布不友善或者负能量的内容，与人为善，比聪明更重要！

帮助

Gemini 3.5 Flash 与 Google 全栈 Agent 发布

Gemini 3.5 Flash 与 Google 全栈 Agent 发布

1. Gemini 3.5 Flash 发布：定位最强 Agent 与编程模型

2. Gemini Omni：从任意输入生成任意内容，从视频开始

3. Antigravity：从 Coding Assistant 到 Agent 执行操作系统

4. Gemini Spark：24/7 个人 AI Agent，跑在云端

5. 搜索 Agent 化：持续监控 + 动态生成 UI

6. 12 小时构建操作系统：93 个并行子 Agent 示范

7. Andrej Karpathy 加入 Anthropic

8. Artificial Analysis 第三方基准：Pareto 前沿领先但成本暴涨

9. SynthID 合作：Google 联手 OpenAI、NVIDIA、ElevenLabs

10. OpenAI 推出「保障容量」：1-3 年锁定计算资源

定价与订阅

社区赞助商

关于 LearnKu

资源推荐

服务提供商

其他信息

Gemini 3.5 Flash 与 Google 全栈 Agent 发布

Gemini 3.5 Flash 与 Google 全栈 Agent 发布

1. Gemini 3.5 Flash 发布：定位最强 Agent 与编程模型

2. Gemini Omni：从任意输入生成任意内容，从视频开始

3. Antigravity：从 Coding Assistant 到 Agent 执行操作系统

4. Gemini Spark：24/7 个人 AI Agent，跑在云端

5. 搜索 Agent 化：持续监控 + 动态生成 UI

6. 12 小时构建操作系统：93 个并行子 Agent 示范

7. Andrej Karpathy 加入 Anthropic

8. Artificial Analysis 第三方基准：Pareto 前沿领先但成本暴涨

9. SynthID 合作：Google 联手 OpenAI、NVIDIA、ElevenLabs

10. OpenAI 推出「保障容量」：1-3 年锁定计算资源

定价与订阅

社区赞助商

关于 LearnKu

资源推荐

服务提供商

其他信息

请登录