新闻 深度 观点 研究 数据 资源 活动 关于

Google I/O 2026:当「够用」比「最强」更划算

Gemini 3.5 Flash 比 2.5 Flash 贵了 5 倍,DeepSeek V4-Flash 比 3.5 Flash 便宜 10 倍。Omni Flash 突破了任意输入输出。I/O 2026 真正的故事在定价表里。

Google I/O 2026 有两个主角,和一个没多少人关心的事。主角是 Gemini 3.5 Flash——几乎全面超过四个月前的 Gemini 3.1 Pro,号称比竞品便宜一半1;和 Gemini Omni Flash——第一个能把文字、图片、音频、视频混在一起当输入、输出视频的模型2。那件没多少人在意的事是 Gemini CLI 停服,只给了一个月时间迁走3

但整场发布会没人明说的是:DeepSeek V4-Flash 只花 3.5 Flash 十分之一的钱,就能干它八成的活,而且权重还是 MIT 开源的——你自己下载跑都行。当模型能力跨过”够用”的门槛,比拼的就不再是”谁更聪明”,而是”谁更便宜”。

3.5 Flash:赢了性能,输在价格

先看 benchmark。3.5 Flash 几乎全面碾压 3.1 Pro1。Pichai 说得很直白:“3.5 Flash 比 3.1 Pro 强,3.1 Pro 才是四个月前的模型。性能到了 frontier 的九成,速度快四倍,价格大概是三分之一到一半。”4

但”一半价格”要看跟谁比:

表1:真正的价格版图 567

模型输入 $/百万token输出 $/百万token许可备注
DeepSeek V4-Flash$0.14$0.28MIT 开源13B 活跃参数,SWE-bench ~79%
DeepSeek V4-Pro (促销价)$0.435$0.87MIT 开源促销截止 5月31日
DeepSeek V4-Pro (标价)$1.74$3.48MIT 开源SWE-bench 80.6%
Gemini 2.5 Flash$0.30$2.50闭源上一代
Gemini 3.5 Flash$1.50$9.00闭源新发布
GPT-5.5 (估)~$2.50~$15.00闭源竞品 frontier
Claude Opus 4.7~$3.00~$15.00闭源竞品 frontier

3.5 Flash 比 GPT-5.5 和 Claude Opus 4.7 便宜,这没错。但 DeepSeek V4-Flash——一个 MIT 开源、你自己就能部署的模型——输入只要 3.5 Flash 的十分之一,输出只要三十二分之一。V4-Pro 的 SWE-bench 拿了 80.6%,跟 Claude Opus 4.7 的 80.8% 基本打平,输出价格只有七分之一8

更尴尬的是跟自家人比:

表2:3.5 Flash vs 自家上一代 56

模型输入 $/百万token输出 $/百万token
Gemini 2.5 Flash$0.30$2.50
Gemini 3.5 Flash$1.50$9.00

输入涨了 5 倍,输出涨了 3.6 倍。Google 不是在给你更便宜的 Flash——是因为性能追上了 Pro 级别,所以价格也追上去了。“半价”只在跟竞品旗舰比的时候成立,跟自己上一代中端线比完全不成立。

到了拐点

事情其实很简单:对绝大多数线上业务来说,问题早就不是”模型能不能干这件事”,而是”干到够用要花多少钱”。

V4-Flash 用 $0.14/$0.28 就能搞定分类、摘要、写常规代码这些占 80% 跑量的活。同样的活切到 3.5 Flash 要花 10 倍价钱,只为那 20% 真正需要 frontier 智能的场景——除非这些场景对你业务有决定性影响,否则这笔账不划算。Google 当然知道这一点,所以 3.5 Flash 的定位是抢竞品的旗舰客户,不是升级自家 Flash 用户。

Google 自己的规模数字倒是有说服力:3 月每天处理 5000 亿 token,到 I/O 的时候已经超过 3 万亿1。规模改善模型,模型吸引用户,用户生成数据,这是飞轮。

Omni Flash:终于不一样了

3.5 Flash 在解决”frontier 太贵”的问题,Omni Flash 解决的是另一个问题:“AI 只会干一件事”。

Omni Flash 把文字、图片、音频、视频随便混着喂进去,出来的是视频2,后面还会加图片和文字生成。Hassabis 说得直白:“从任意输入生成任意输出”9

表3:Omni 现在能做什么 vs 将来能做什么 210

输入当前输出计划输出
文字、图片、音频、视频10 秒视频+ 图片、文字
相册上传角色一致性数字分身多场景叙事
手绘 / 草图对话式编辑完整后期制作

Omni 的亮点不在于能生成视频——Veo 和其他模型也能做。亮点在于它不先把所有输入转成文字再处理,而是直接在多种模态之间做推理。它理解物理(重力、流体、动能)10,能跨场景保持角色和声音的一致性,还可以让你用自然语言编辑自己拍的视频。

这才是真正有意思的地方——你不需要时间线编辑器。说一句”把背景换成海滩”,模型就在保留原始运动轨迹的同时改掉画面。这跟文生视频是两个品类。

所有生成内容都有 SynthID 水印10,语音编辑功能暂不开放(安全考量)10

Omni Pro 才是真正值得等的

Google 确认 Omni Pro 在开发中,但表示要等到”相对 Flash 有实质性飞跃”才放出来11。这个判断是对的。10 秒片段加对话式编辑够消费者玩,但广告、影视、建筑可视化这些专业场景需要更高分辨率、更长时长、更精确的控制。Omni Pro 如果真能做到这个飞跃,对视频制作的影响可能跟 Stable Diffusion 对图片生成的影响一样大。

CLI 停服:小事引大风

全场最小的一条公告反而在开发者里炸了锅。6 月 18 日 Gemini CLI 停服,个人和免费用户只有一个月时间迁到 Antigravity CLI3。企业不受影响。

Hacker News 上有人说得很直白:“每 6 个月就改名或砍掉的工具,你怎么可能在上头建稳定工作流?”12 Google 的解释倒也说得过去:单 agent 终端工具撑不起多 agent 协作,Antigravity CLI 用 Go 重写、支持异步、跟 Antigravity 2.0 桌面共享 agent harness3。但”30 天通知砍你工具”这个信号——尤其在 OpenAI 和 Anthropic 都在签多年协议的市场里——很难收回。

参考来源

结语

I/O 2026 真正有意思的东西不在主题演讲上,在定价表里。3.5 Flash 比 2.5 Flash 贵 5 倍——确实更强,确实有人愿意付这个钱。但 DeepSeek V4-Flash 比 3.5 Flash 便宜 10 倍,权重还是 MIT 开源的。“Frontier 性能半价”在 V4-Flash 面前不是新闻,是谈判筹码。

Omni Flash 是另一回事——真的有新东西。任意输入出连贯视频,物理理解,对话式编辑,这些创造了一个之前没有的产品品类。Omni Pro 到了的时候,可能跟 Stable Diffusion 对图片的影响一样大。

CLI 停服这种小事反而透露了信号:Google 在卖速度,OpenAI 和 Anthropic 在卖稳定。谁更值钱,市场说了算。

Footnotes

  1. Google 官方博客 — Sundar Pichai I/O 2026 主题演讲 — 3.5 Flash benchmark、定价、3 万亿 token 规模、10 亿美元节省 https://blog.google/innovation-and-ai/sundar-pichai-io-2026/ 2 3

  2. Google I/O 2026 官方汇总 — Gemini Omni:“从任意输入创造任意输出,先从视频开始” https://blog.google/innovation-and-ai/technology/developers-tools/google-io-2026-collection/ 2 3

  3. Google Developers Blog — Gemini CLI 迁移至 Antigravity CLI — 6 月 18 日截止、Go 重写、共享 agent harness https://developers.googleblog.com/en/search/?query=Gemini+CLI 2 3

  4. VentureBeat — Google 称 Gemini 3.5 Flash 每年可为企业节省超 10 亿美元 — Pichai 关于 90% frontier 性能和 1/3-1/2 价格的引述 https://venturebeat.com/technology/google-says-gemini-3-5-flash-can-slash-enterprise-ai-costs-by-more-than-1-billion-a-year

  5. Gemini Developer API 定价页面 — 所有模型官方定价 https://ai.google.dev/gemini-api/docs/pricing 2

  6. BenchLM.ai — Gemini API 定价分析(2026年4月) — 详细价格对比和每次请求成本 https://benchlm.ai/blog/posts/gemini-api-pricing 2

  7. DeepSeek API 定价 — V4-Flash $0.14/$0.28、V4-Pro $1.74/$3.48(标价),75% 促销至 5 月 31 日 https://api-docs.deepseek.com/quick_start/pricing

  8. Codersera — DeepSeek V4 Pro vs Flash:Benchmark 与定价 2026 — SWE-bench 80.6%、Terminal-Bench 67.9%、定价 $0.14/$0.28 (Flash) 和 $1.74/$3.48 (Pro 标价) https://codersera.com/blog/deepseek-v4-pro-vs-flash/

  9. LatestLY — Gemini Omni 发布 — Hassabis 关于任意输入任意输出长期愿景 https://www.latestly.com/technology/gemini-omni-launched-google-unveils-new-ai-video-generator-at-io-2026-7437717.html

  10. Times of India — Google 迈向 AGI 的下一步 — Omni 物理模拟、SynthID 水印、安全 withheld https://timesofindia.indiatimes.com/technology/tech-news/google-takes-next-big-step-towards-agi-launches-gemini-omni-what-is-it-how-it-works-and-more/articleshow/131210372.cms 2 3 4

  11. Firstpost — Google I/O 2026:Gemini Omni Flash 上线 — Hassabis 现场演示、Omni Pro”实质性飞跃”评述 https://www.firstpost.com/tech/google-i-o-2026-gemini-omni-flash-arrives-with-more-accurate-ai-video-generation-than-veo-14012977.html

  12. Hacker News — Gemini CLI 将于 2026 年 6 月 18 日停止服务 — 开发者社区对短迁移窗口和产品频繁更迭的讨论 https://news.ycombinator.com/item?id=48196867