发生了什么
距离 Google I/O 2026(5 月 19-20 日)还有两周,多个泄露信息拼出了 Google 即将发布的 AI 路线图:
核心泄露:Gemini “Omni” 统一多模态模型
- Gemini 视频生成界面出现 “Powered by Omni” 的泄露截图
- “Omni” 是 Google 内部代号为 “Toucan” 的全新多模态模型
- 设计目标:在单一模型内统一文字、图片、视频、音频的跨模态推理
- 视频生成质量据称”明显优于当前 Veo 系统”
其他预热信息
- Gemini 3.2/3.5:可能在 I/O 上公布路线图更新
- Gemini App 重新设计:从聊天机器人向 AI 工作空间转型
- Android 版 AI Studio:开发者工具移动端化
这条泄露信息在 Twitter 上获得了 965 个赞和 67 次转发,浏览量超过 13 万次。
为什么重要
”Omni” 的战略意义
Google 正在走一条与竞品截然不同的路线:
| 公司 | 多模态策略 | 代表产品 |
|---|---|---|
| 统一模型(Omni):所有模态集成在一个模型中 | Gemini Omni | |
| OpenAI | 分立模型协作:GPT-5.5 处理文本 + Image 处理图片 + Video 处理视频 | GPT 系列 + Image-2 + Video |
| Anthropic | 渐进式多模态:Claude 逐步增加视觉/文档能力 | Claude Sonnet 4.8(512K 行代码上下文) |
| 字节跳动 | 视频专精模型:Seedance 2.0 专注视频生成 | Seedance 2.0 |
统一模型的优势在于跨模态理解:模型可以同时”看到”图片、“理解”文字、“生成”视频,在单一上下文中完成跨模态推理。这在复杂任务(如根据文字描述生成视频,同时参考图片风格)中具有显著优势。
视频生成战局升级
2026 年的视频生成赛道已经白热化:
| 模型/平台 | 公司 | 特点 | 最新状态 |
|---|---|---|---|
| Seedance 2.0 | 字节跳动 | 高质量视频生成,开放 API | 已上线 |
| Veo | Google 原有视频模型 | Omni 将替代或升级 | |
| Sora | OpenAI | 早期领导者 | 持续迭代中 |
| Kling | 快手 | 国产视频模型 | 活跃更新 |
| Omni (泄露) | 统一多模态,跨模态推理 | I/O 大会即将公布 |
Gemini 视频界面泄露的 “Powered by Omni” 截图表明,Google 已经将新模型集成到了产品中——这不是概念演示,而是即将上线的功能。
与已有报道的关联
我们此前报道过 Google I/O 的 Gemini Omni 泄露,但当时的信息主要集中在”多模态统一”概念上。本次更新的泄露信息明确了两个关键点:
- Omni 已实际集成到 Gemini 视频生成界面——不再是纸面计划
- 视频质量对标 Seedance 2.0——Google 直接挑战字节跳动的视频生成优势
可以怎么用
开发者的准备清单
Google I/O 还有两周,建议提前准备:
- 关注 API 变更:Omni 模型可能引入全新的多模态 API 格式
- 评估迁移成本:当前使用 Veo 的项目可能需要适配 Omni
- 对比 Seedance 2.0:两者可能各有优势场景,建议同时测试
内容创作者的机会
- Omni 模型的视频生成能力一旦开放,可能降低视频创作门槛
- 结合 Gemini 的长上下文(此前已有 200 万 token 能力),可生成更复杂的叙事视频
- 与 Seedance 2.0 形成双雄竞争格局,用户受益
企业应用场景
| 场景 | Omni 预期能力 | 商业价值 |
|---|---|---|
| 营销视频生成 | 文字描述→视频,参考品牌风格图 | 降低视频制作成本 |
| 培训材料制作 | 文档→教学视频 | 加速知识传递 |
| 产品设计可视化 | 草图→3D 视频展示 | 缩短设计迭代周期 |
| 社交媒体内容 | 一句话生成短视频 | 提升内容产出效率 |
格局判断
Google 通过 Omni 模型传递的信号是:2026 年的 AI 竞争不再是比较单一模态的能力,而是比较跨模态统一的能力。
OpenAI 选择多模型协作路线,Anthropic 选择渐进式增强,Google 选择大一统模型。三条路线各有优劣,但 Omni 如果能在 I/O 上展示出真正的跨模态推理能力,将重新定义多模态 AI 的标准。
行动建议:
- 视频创作者:等待 I/O 发布后对比 Omni vs Seedance 2.0
- 开发者:关注 Omni API 的发布节奏和定价
- 企业用户:评估 Google 多模态生态(Gemini + Omni + Workspace)的整合价值