资讯

Google I/O 2026:从搜索框到代码编辑器,Google 全面 Agent 化

2026-05-20 #Google#Google IO#Angets

两个小时,数十个产品更新,一股脑砸出来。Google I/O 2026 又一次用”饱和式发布”刷屏。所有重要更新都指向同一个词——Agent

“最前沿的 Agent 可能只触达过世界上 0.1% 的人。真正的问题,是怎么把这种前沿能力规模化交付给更广泛的用户。”
——Sundar Pichai

Google 这次要自己来做这件事。下面是它给出的答案。


一图速览:本次 I/O 七大重磅

编号 发布 核心看点
01 Gemini 3.5 系列亮相 Flash 先出,Pro 下月上线
02 Gemini Spark 对标 OpenClaw,24/7 在线的个人 Agent
03 Antigravity 2.0 从编程环境升级为多 Agent 编排平台,正面对位 Claude Code 与 Codex
04 Gemini Omni 任意模态进,任意模态出,集成 Veo 与 Nano Banana
05 Gemini app 全面 Agent 化 新设计语言 Neural Expressive,内置 Daily Brief
06 搜索与全家桶”小 Gemini”化 搜索框 25 年来最大升级;Information Agents 与 Generative UI 登场
07 订阅价调整 新增 100 美元/月档位,原 250 美元 Ultra 降到 200,Pro 维持 19.99

一、3.5 Flash:把”Agent 经济账”摆上桌

Gemini 3.5 系列的第一款 3.5 Flash,在几乎所有基准上超越自家上代 Gemini 3.1 Pro。Pichai 特意点名的 GDPval(衡量”具有真实经济价值的任务”)上提升尤其明显。

但真正让它登上 keynote C 位的,是另一组数据:

  • 速度:输出速度是其它前沿模型的 4 倍;在 Antigravity 2.0 中内置的优化版本可达 12 倍,质量不变。
  • 价格:不到同档前沿模型的 一半

Pichai 直接把性价比换算成账单摆给 CIO 们看:

“如果一家头部企业一天处理一万亿 token,把其中 80% 的负载从其它前沿模型迁到 3.5 Flash,一年能省下 超过 10 亿美元。”

Google 自己已经是这套打法最大的受益者。今年 3 月,Google 内部每天处理 5000 亿 token;现在每天超过 3 万亿,每隔几周翻一番。增长来源,是工程团队全面切换到 Antigravity 2.0 + 3.5 Flash 之后释放出来的需求。

更强大的 Gemini 3.5 Pro 没在这次发布 —— 预计将在下个月 2026 年登场,Pichai 透露:”内部在用,效果很好,但还在打磨”。


二、Gemini Spark:Google 的个人 Agent 终于落地

Spark 是这次回答”Agent 怎么走出 0.1%”最直接的产品:一个 7×24 跑在云端的个人 Agent,把 Google 全家桶串了起来。

它运行在 Google Cloud 的专用虚拟机上,底层是 Gemini 3.5,框架用的是 Google 内部的 Antigravity Harness。也就是说,笔记本合上、手机锁屏,它也能继续在后台跑长周期任务。

Google 给 Spark 设定的第一批场景并不科幻:从 Gmail、Docs、Sheets、Slides 里拉事实,写状态汇报;帮学生更新学习指南;替家长追踪学校时间表;给小企业盯收件箱,避免漏掉客户问题。

真正重要的不是这些 demo,而是它的落点:Spark 是 Google 把 Agent 从”聊天窗口”推进”真实数字生活”的第一只脚。它先接 Google 自家工具,随后开放第三方 MCP;入口先在 Gemini app,之后会进入邮件、聊天、Chrome,Android 上还有 Android Halo 显示执行进度。

节奏也很明确:先给受信任测试者,下周作为 beta 推给美国 Google AI Ultra 订阅用户。敏感操作前停下来确认,用户可以看到执行过程并随时打断——这套信任设计,是 Google 试图让普通人敢把任务交给 Agent 的前提。


三、Antigravity 2.0:正面对位 Claude Code 与 Codex

Antigravity 1.0 大约半年前(2025 年 11 月)发布,目前已有”数百万开发者在用”。2.0 的关键变化是定位转移——从”编程环境”升级为”多 Agent 编排平台”。

三层架构:

  1. 桌面 App:与 Agent 交互的中央枢纽,可同时编排多个 Agent——一个写网站代码、一个生成品牌素材、第三个规划产品架构,互不打架
  2. Antigravity CLI:命令行接口,留给想待在终端里的开发者
  3. Antigravity SDK:最关键的一层——让程序可编程地访问驱动 Google 自家产品的同一套 Agent harness,与 Gemini 模型协同优化

一个内部案例:在尚未发布的 Gemini 3.5 Pro 支持下,让 93 个不同 Agent 协作,消耗 26 亿 token,从零搭建起一个复杂系统项目。

换句话说,Google 试图把内部正在使用的 Agent harness 以 SDK 形式开放给开发者。这是对 Claude Code 和 Codex 的正面对位。

Pichai 在沟通中的判断:

“开发者这个群体的好处是,你把东西做出来,如果真的好用,他们就会真的用。Antigravity 加 3.5 Flash 是相当魔幻的体验,特别是它有多快 —— 3.5 Flash 已经是其它前沿模型的 4 倍,在 Antigravity 里大约是 12 倍。”

更有说服力的支撑来自内部测试:用 3.5 Flash + Antigravity 2.0 跑多 Agent 协同,让 Agent 完全从零搭出了一个能跑的操作系统,API 耗费在 1000 美金以内

附带发布:安全 Agent CodeMender

CodeMender 用 Gemini 的高级推理自动找出并修复关键代码漏洞,直接下笔补漏洞,等于接管”人来打补丁”那一步。当前邀请少数专家测试 API,更广泛开放”很快”推出。

Google 的逻辑:随着 Agent 写越来越多代码,cybersecurity 会更关键,agentic workflow 也是这个领域的必由路径。


四、Gemini app:彻底换新 + 全面降价

Gemini app 过去一年月活从 4 亿涨到 9 亿,日请求量翻 7 倍,覆盖 230 个国家、70 种语言。Google 把它定义为”世界上覆盖最广的 AI 助手”。

这次 Gemini app 的改版,表面上是新设计语言 Neural Expressive:动效、色彩、字体、触感反馈全换,回答也不再是一整面文字墙,而是图片、时间线、图表和 Gemini Live 混在一起的动态页面。

但它真正的变化,是从”问答 app”变成 Agent 的前台。Gemini Omni 直接进 app,用户可以上传照片或视频,套模板、改风格、生成视频,甚至创建一个看起来和听起来都像自己的 AI 化身。

Daily Brief 则是第一个开箱即用 Agent:每天早上整理 Gmail、日历和当天任务,排优先级,给下一步建议。它的前身是 2025 年 12 月在 Google Labs 上线的实验 CC,这次被收编进正式产品线。这个路径很能说明 Google 的打法:Labs 里跑通,Gemini app 里规模化。

5 月 19 日起,Neural Expressive 全球开放;Daily Brief 在美国面向 Google AI 订阅用户开放。

订阅价调整

档位 价格 变动
Pro 19.99 美元/月 维持
Ultra(新增) 100 美元/月 新档位,给”想要重度 Agent 服务但还没到顶配水位”的用户
Ultra(顶配) 200 美元/月 从 250 美元下调

2025 年 5 月 Google 才把顶级 Ultra 定在 249.99 美元,一年时间实际**降价 20%**,中间还加了一档。意图很清楚:把 Spark 这种重度 Agent 服务的通道铺宽,让普通付费用户也能摸到。


五、Gemini Omni:把 Veo 和 Nano Banana 揉进 Gemini 主架构

如果说 3.5 Flash 是为”让 Agent 跑起来”准备的,那么 Gemini Omni 是为”让 world model 真的成型”准备的。这部分由 Demis Hassabis 亲自发布。

Google 给 Omni 的定位是 **”能从任何输入生成任何输出模态的模型”**,先做视频输出,未来扩展到图像和文字。

  • 第一款上线:Gemini Omni Flash,5 月 19 日起向 Google AI 订阅用户开放
  • 入口:Gemini app、Google Flow、YouTube Shorts
  • 水印:所有 Omni 生成或编辑的内容自带 SynthID
  • Omni Pro:即将推出

Omni 与 Veo、Nano Banana 的关系

按 Google 自己的描述:

Omni 是 Gemini 主架构的进化,是 Gemini 一开始原生多模态底层设计的延伸——让原生多模态从输入端扩展到输出端。视频生成是切入点(离 Veo 最近),再把 Nano Banana 的编辑能力带进 Veo,让你像剪辑那样自然修改视频。本质上 Omni 是 Gemini 主线进化,Veo 和 Nano Banana 是它身上的能力组件。

Nano Banana 累计已生成超过 500 亿张图,Omni 这次把这个能力同等带到视频里。玩法包括纯文本生成视频,也包括上传自己的视频做改风格、换角色、保持时间一致性的连续编辑。


六、搜索 + 全家桶:Agent 进入 Google 每个角落

搜索框 25 年来最大一次升级

AI Mode 一周岁了——2025 年 I/O 才推出,现在月活超 10 亿,”上线以来每季度查询量翻倍”。

这次 AI Mode 升级到 Gemini 3.5 Flash 驱动。Google 搜索团队的判断是:用户已经开始把搜索当成更长、更具体、更跨模态的任务入口,而不是几个关键词。

所以 Google 改了那个最核心的入口——搜索框。新的智能搜索框会扩展,能容纳更口语化的长问题;AI 查询建议取代传统自动补全;文字、图片、文件、视频、Chrome 标签页都可以作为输入。AI Overviews 和 AI Mode 也被打通,用户可以从一个概览回答直接继续追问。

更关键的是,搜索框里开始长出 Agent。

Information Agents 让搜索从”查一次”变成”后台持续盯一件事”:用户可以创建 24/7 跑的 Agent,让它监控市场、房源、体育、购物或任何特定问题,条件触发后合成更新推送。

Generative UI 和搜索里的 mini-app,则是另一条线:把 Antigravity 和 Gemini 3.5 Flash 的 agentic coding 能力接进搜索现场。用户问一个复杂问题,搜索不只是返回答案,还能实时生成交互图表、模拟器、仪表盘甚至可持续使用的小工具。

这才是 Google 最可怕的分发能力:别人要教育用户去打开一个 Agent 产品,Google 只需要让搜索框多长出一层能力。


七、虽迟但到的 Google,用全栈布局对卷 Agent 赛道

过去一段时间 Google 在 Agent 的竞争里几乎缺席。这场 I/O 可以看出它的焦虑——它给出的答案是一套全栈布局

  • 模型层:3.5 Flash 用速度和价格把 Agent 的边际成本压到企业可接受的位置;Omni 把 world model 再推一步
  • 产品层
    • Spark 给所有人
    • Daily Brief 给所有 AI 订阅用户
    • Information Agents 与 Generative UI 让 Agent 进入 Google 最广泛的”渠道”——搜索框
    • Antigravity 2.0 给开发者提供 Claude Code 的直接”平替”
  • 商业层:UCP、AP2、Universal Cart 让 Agent 进入真实交易场景
  • 基础设施层:第八代 TPU 首次走”双芯片”分工——TPU 8T 专做训练,TPU 8I 专做推理。配合 JAX 与 Pathways,训练任务可跨多个数据中心、全球分布到超过 100 万颗 TPU——“世界最大的训练集群”

几个让 Anthropic 和 OpenAI 忌惮的数字

  • Google 的 AI 在各个主要产品里的用户量级全部是十亿级别
  • 5 个产品已各自有 30 亿用户
  • 今年 capex 预计 1800–1900 亿美元,是 2022 年(310 亿)的 6 倍
  • 每月跨自家产品处理的 token 达到 3.2 千万亿(quadrillion),是 2025 年 I/O 时 480 万亿的 7 倍

总结

把这些点连起来,Google 这次真正要证明的不是”我们也有 Agent”,而是:我们有能力把 Agent 变成默认入口。

模型足够快,边际成本才能压下来;Spark 跑在云端,Agent 才能真正离开用户设备;Gemini app 和搜索框提供日常入口,用户不用重新养成习惯;订阅价格下探,重度 Agent 服务才有机会从少数极客扩散到普通付费用户。

对开发者工具战场也是同一个逻辑。Antigravity 2.0 不是简单复制 Claude Code 或 Codex,而是在把竞争从”谁的代码补全更聪明”推向”谁能提供模型、运行环境、工具调用、sub-agent 编排和分发入口的一整套 Agent harness”。

如果这个判断成立,下一轮开发者工具竞争的单位就不再是 IDE 插件,而是平台级 Agent 编排系统。Claude Code、Codex、Antigravity 争的也不只是程序员的编辑器,而是谁能成为开发者让一群 Agent 持续工作的控制台。

所以,这场 I/O 更像是一个信号:Google 没有退出 AI 主战场,它只是选择用自己最熟悉的方式参战——把模型、产品、入口、基础设施和商业系统一起压上来。

Agent 赛道接下来不会只比谁的模型更聪明,也会比谁能把能力稳定、便宜、可信地送到最多人手里。Google 的优势正在这里重新变得清晰。

对普通用户来说,这反而是最好的局面:顶级大模型厂商越焦虑,工具就会越强、越便宜、越触手可及。每一次”轰炸式发布”背后,都是另一家公司被迫拿出更好的产品、定一个更低的价格。

评论
分享

评论