Gemini Omni 完整爆料：Google I/O 2026 前的所有泄露信息

Gemini Omni 是一款尚未正式发布的 Google 视频生成产品代号，于 2026 年 5 月 2 日 出现在 Gemini 应用的 UI 中，距离 Google I/O 2026（5 月 19–20 日开幕）仅剩八天。目前公开可证实的证据只有一条泄露字符串 ——"Start with an idea or try a template. Powered by Omni."—— 由 TestingCatalog 在 Gemini 的视频生成标签页中发现并曝光。截至 2026 年 5 月 11 日，Google 尚未对 Omni 作出任何官方确认。

本文将在 Google 官方公布任何相关信息后的 24 小时内更新。

Gemini Omni 是什么？

截至 2026 年 5 月 11 日，Gemini Omni 只是一个存在于 Google 内部预发布代码中的产品名称。没有规格、没有演示、没有模型卡，也没有 Google 的官方宣传材料。"Omni" 这个名称暗示着多模态能力 —— 可能涵盖图像、视频，乃至音频于一体 —— 但 Google 既未公开、也未泄露任何技术细节。除那条 UI 字符串以外的一切，都只是分析师的推断。

这次泄露之所以值得关注，是因为 Omni 与 "Toucan" 并列出现 ——Toucan 是 Gemini 现有视频生成入口的内部代号，目前由 Veo 3.1 提供支持。在现有产品名称旁边预先放置一个新的公开产品名称，是 Google 在正式发布前 1–2 周替换底层引擎或重新命名前端入口的标准做法。

泄露的内容是什么，从何而来

Gemini 应用中发现的"Powered by Omni"UI 字符串

这次泄露的信息量不大，但来源异常清晰。以下是公开可验证的内容，以及不可验证的部分。

精确的 UI 字符串

2026 年 5 月 2 日，一张 Gemini 应用视频生成标签页的截图浮出水面，其中包含这样一行文字："Start with an idea or try a template. Powered by Omni." TestingCatalog 当天发布了这张截图，WaveSpeed 紧接着在 5 月 3 日发布了分析文章。

这段字符串在此前任何公开版本的 Gemini 中都未曾出现。截至本文发布之时，它仍仅存在于测试环境中 —— 大多数用户在生产环境的 Gemini 应用中看不到它。

这能证明的是：Google 已经将一个新的产品名称 ——"Omni"—— 推入了一个涉及消费级 Gemini UI 的构建管线。但这无法证明：Omni 是一个新模型、它能做到任何 Veo 3.1 做不到的事，也无法证明它会在 Google I/O 2026 上面向公众发布。

Toucan 是什么，Omni 又如何与之并列

"Toucan" 是 Gemini 现有视频生成标签页的内部代号 —— 也就是用户今天在 Gemini 应用中生成视频片段时看到的那个入口。Toucan 当前由 Veo 3.1 驱动，后者是 Google 目前部署的旗舰视频模型。Toucan 此前也是通过类似的 UI 字符串考古发现的，它本身并不是一个模型。

在 2026 年 5 月 2 日的泄露中，"Omni" 出现在了与 Toucan 引用相同的 UI 区域内。正是这种并置关系，让此次泄露从"一段随机字符串"升级为"即将到来的产品发布"。Google 替换消费级模型的标准流程，是在正式宣布前 1–2 周将新产品名推入代码，进行并行预发布，然后在主题演讲当天完成切换。

Omni 的三种合理解读

自 5 月 2 日以来，业内分析对 Omni 究竟是什么的讨论，已经收敛到三种相互竞争的解读。这三种解读中，没有任何一种得到官方确认。

解读一 —— Veo 流水线的品牌重塑

Omni 是同一个 Veo 驱动后端的新消费级产品名称。实际生成仍由 Toucan/Veo 3.1 完成，只是更换了标签。这是干扰最小的解读，也能解释 Google 为何没有提前向媒体做风声 —— 因为没有新技术需要预热。支持证据：Google 一直在向消费友好、抽象掉底层模型的产品命名方式靠拢 ——"Toucan" 本身就从未作为面向用户的标签出现过。

解读二 —— Gemini 自研的新视频模型

Omni 是在 Gemini 体系内训练的全新视频模型，与 Veo 并行存在。在这种解读下，Veo 仍然是面向企业的 Vertex AI / Google Cloud 产品，而 Omni 成为 Gemini 应用中的消费级支柱。这能解释 "Omni" 这个名称 —— 它指向模型本身，而非一个包装层 —— 并且符合 Google 一贯保持消费与企业模型双轨并行的历史。

解读三 —— 图像、视频、音频统一的全模态模型

Omni 是 Gemini 自研全新模型家族的首个成员，能够在单次前向推理中同时完成图像生成、视频生成和同步音频。这是最具野心的解读：它意味着一个模型将同时取代 Gemini 内当前的 Veo 视频流水线和 Nano Banana Pro 图像栈。"omni" 这一名称是这种解读最有力的依据，但目前没有任何泄露明确支持同步音频或图像+视频统一 —— 这完全是从名称本身做出的推断。

Gemini Omni 何时发布？

Google I/O 2026 主题演讲期待

最有可能的发布窗口是 Google I/O 2026，即 2026 年 5 月 19–20 日 —— 距离本文发布仅八天。Google 已确认 Gemini 和 AI 更新进入主题演讲议程。过往 Gemini 发布中观察到的 1–2 周预发布模式，使主题演讲当天揭晓成为可能性最高的结果。

相邻的泄露也支持 I/O 发布的判断。曝光 "Omni" 的同一轮 UI 排查，也曝光了对 "Gemini 3.2" 和 "Gemini 3.5" 的引用（@pankajkumar_dev，2026 年 5 月 3 日）—— 意味着 Google 可能将 Omni 作为更广泛的 Gemini 3.2 / 3.5 模型发布中的视频生成支柱一并推出。

不过这种判断有两点不可忽视的风险：(1) Google 此前也曾出现过 UI 字符串预先泄露、但产品比最初泄露时间晚 1–3 个月才落地的情况；(2) "Powered by Omni" 也可能始终是一个仅存在于开发版本中的标签，即便 I/O 当天面向消费者的实际放量仍然只覆盖一小部分用户。今天能站得住脚的说法是：I/O 2026 公布是最可能的结果 —— 但并非确定无疑。

Omni 在竞品格局中的位置

Gemini Omni vs Veo、Sora、Seedance 竞品格局

由于 Omni 没有公开的基准测试、能力清单或样例输出，任何关于质量的对比都只能是猜测。但状态和结构性定位是可以对比的 —— 也就是各家在 2026 年 5 月的视频生成版图中分别占据什么位置。

模型	状态（2026 年 5 月 11 日）	原生音频	公开最长片段时长	当前可在何处试用
Gemini Omni	已泄露，未公布	传闻有，未确认	未知	暂未开放
Veo 3.1（Toucan）	已在 Gemini 上线，同时在 Vertex AI	支持	配合场景延伸约 15 秒	lovegen.ai/zh/veo3-1
Sora 2	自 2025 年起上线	支持	可变，支持编辑	Sora 应用、lovegen.ai
Seedance 2	已上线，当前公开榜单领跑者	支持	视套餐而定	lovegen.ai

现阶段真正起决定作用的，是分发能力。 截至 2026 年 5 月，Seedance 2.0 领跑公开视频生成基准，但主要通过专门工具触达创作者；Sora 2 凭借独立应用获得消费级触达。如果 Omni 在 Gemini 应用内上线，它将默认继承 Gemini 现有的消费用户基数。无论其原始输出质量是否能跻身第一梯队，这都是 Omni 最有可能产生影响的维度。

已知信息 vs. 未知信息

这则报道里最重要的背景，就是泄露已证实的事实与分析师外推之间的差距。在 I/O 2026 之前，请把右侧标注 "推测" 的内容当作流言对待。

论断	状态	来源
Gemini 构建管线中存在一个名为 "Omni" 的产品	已证实	TestingCatalog，2026 年 5 月 2 日
泄露 UI 字符串为 "Start with an idea or try a template. Powered by Omni."	已证实	@testingcatalog 推文
Omni 出现在 Gemini 视频生成标签页中，与 Toucan 并列	已证实	TestingCatalog
Toucan 目前由 Veo 3.1 驱动	已证实	TestingCatalog
Omni 是新模型（而非 Veo 的品牌重塑）	推测	WaveSpeed 分析
Omni 在单一模型中处理图像 + 视频 + 音频	推测	基于 "Omni" 名称的推断
Omni 生成同步空间音频	推测	未注明来源的流言
Omni 性能优于 Veo 3.1	推测	TestingCatalog 推测性表述
Omni 将在 Google I/O 2026（5 月 19–20 日）发布	报道中 / 较有可能	预发布模式推断加 I/O 议程
Omni 与 Gemini 3.2 或 3.5 配套发布	报道中	@pankajkumar_dev，2026 年 5 月 3 日
定价、可用层级、区域放量节奏	未知	暂无泄露

I/O 2026 之前，创作者该怎么做

本文发布与 I/O 主题演讲之间只剩八天，时间很短，但确实存在。三种读者场景 —— 三种不同的答案。

如果你正在用 Veo 3.1 做项目

在 Veo 3.1 上把项目做完。不要因为 Omni 可能在 I/O 推出就暂停手头的工作。两个原因。第一，即便按最乐观的解读（主题演讲当天发布新模型），Omni 的首发放量也很可能仅限一小部分用户，要达到普遍可用可能还需要数周。第二，你在 Veo 3.1 上积累的提示词技巧，可以直接迁移到 Gemini 家族任何后续模型 ——Google 在 Veo 各代之间的提示词语法保持了相当的稳定性。

如果你正在 Sora 2、Seedance 2 之间选型，或者考虑等待

如果你的交付节点在 30 天以外，再等一周看 I/O 公告几乎没有成本 —— 而那场公告会对决策产生实质影响。如果你在七天内就要交付，今天站得住脚的选项是 Seedance 2（当前榜单领跑者）或 Sora 2（消费级流程最成熟）。仅凭一句 "Powered by Omni"，还不足以作为生产环境承诺的依据。

如果你用 Nano Banana Pro 做图像 + 视频组合

Gemini 当前的图像+视频工作流由两个模型组成：Nano Banana Pro 负责图像，Veo 3.1 负责视频。如果解读三成立，Omni 是一个统一的全模态模型，你的工作流将变得更简单 —— 一个模型搞定两件事。但在 I/O 确认之前，请把目前的 Nano Banana Pro → Veo 3.1 衔接路径视为受支持的方案，不要基于推测重构生产管线。

常见问题

Gemini Omni 是什么？

Gemini Omni 是一款尚未正式发布的 Google 视频生成产品代号，于 2026 年 5 月 2 日出现在 Gemini 应用的 UI 中。目前公开可证实的证据只有一条字符串 ——"Start with an idea or try a template. Powered by Omni."—— 出现在视频生成标签页中。截至 2026 年 5 月 11 日，Google 尚未正式公布 Omni，但它与 Toucan（Gemini 现有的、由 Veo 3.1 驱动的视频工具）的并列出现，暗示它正在为 Google I/O 2026 的发布做最后准备。

Gemini Omni 是否已经被官方公布？

没有。截至 2026 年 5 月 11 日，Google 没有就 Gemini Omni 作任何官方表态。唯一的公开证据，是 TestingCatalog 于 2026 年 5 月 2 日曝光的一次 UI 字符串泄露。除泄露字符串以外的任何功能描述 —— 同步音频、更高分辨率、图像+视频统一 —— 都属于分析师的推测，而非 Google 的声明。

Gemini Omni 什么时候发布？

最有可能的发布窗口是 Google I/O 2026，举办时间为 2026 年 5 月 19–20 日 —— 即本文发布后八天。Google 已确认 Gemini 与 AI 更新进入主题演讲议程。为期两周左右的预发布字符串布置，是一种标准的发布前模式，但没有任何 Google 官方信源确认 Omni 一定会出现在 I/O 上。延后到其他时点公布的可能性也无法排除。

Omni 会取代 Gemini 中的 Veo 3.1 吗？

可能会，但尚未得到确认。泄露的 UI 显示 Omni 出现在 "Toucan" 旁边，而 Toucan 是 Gemini 内部对现有 Veo 3.1 驱动视频工具的代号。在现有产品名旁边放置一个新名称，是替换前的典型预发布模式 —— 但 Google 也可能继续将 Veo 保留为 Vertex AI / Cloud 端的企业产品，同时把 Gemini 端面向消费者的体验重新命名为 Omni。

Gemini 里的 Toucan 是什么？

Toucan 是 Gemini 当前视频生成工具的内部代号 —— 也就是用户今天在 Gemini 应用中生成由 Veo 3.1 驱动的视频片段时所看到的那个标签页。Toucan 此前同样是通过类似的 UI 字符串泄露被发现的，它本身并不是一个独立于 Veo 的模型。2026 年 5 月的泄露发现 "Omni" 出现在与 "Toucan" 同一 UI 区域，暗示着平行存在或替换的关系。

Gemini Omni 也会做图像生成吗？

未知。泄露的 UI 字符串只提到视频生成。但 "Omni" 这一名称本身暗示了多模态能力 —— 图像、视频，乃至音频于一体 —— 这将与 Google 目前由 Nano Banana 2 和 Nano Banana Pro 负责图像生成的安排有明显不同。"统一的全模态模型" 是分析师提出的三种合理解读之一，但目前没有任何信息得到确认。

Gemini Omni 与 Sora 2 相比如何？

直接对比并不可能，因为 Omni 没有公开的基准测试、没有公开输出、也没有得到确认的能力清单。相比之下，Sora 2 自 2025 年起向公众开放，已经具备得到验证的片段长度、音频支持和编辑控件。今天最站得住脚的判断是：如果 Omni 在 I/O 2026 上发布，它将是 Google 至今为止针对 Sora 2 在消费市场推出的最严肃回应。

Gemini Omni 与 Seedance 2.0 相比如何？

截至 2026 年 5 月，字节跳动的 Seedance 2.0 在公开视频生成基准上处于领先位置。Omni 没有基准数据，任何质量层面的对比都只是推测。结构性差异在于分发：Seedance 2.0 是面向创作者的 API + 应用产品；而 Omni 如果在 Gemini 应用内发布，将默认触达 Gemini 现有的消费用户基础 —— 这个分发面比 Seedance 当前掌握的要宽得多。

Omni 会生成同步音频吗？

同步音频是 Omni 最被频繁讨论的功能，但既未被 Google 确认，也未在泄露的 UI 字符串中出现。这个流言一部分来自 "Omni" 名称本身（暗示多模态），一部分来自分析师外推。如果 Omni 真的内建同步音频，它将弥补 Google 视频输出与 Sora 2 之间最常被提及的差距 ——Sora 2 自上线起就支持音视频同步。

Omni 与 Gemini 3.2 或 3.5 有关吗？

可能有关。曝光 "Omni" 的同一轮 UI 排查，也曝光了对 Gemini 3.2 和 Gemini 3.5 的引用，意味着下一代 Gemini 模型正在与 Omni 一同进入预发布阶段。今天最站得住脚的判断是：Google 可能在 I/O 2026 上将 Omni 作为更广泛的 Gemini 3.2 / 3.5 发布中的视频生成支柱推出。具体的配套关系尚未得到确认。

我以后要怎么试用 Gemini Omni？

如果参考过往 Google 的发布节奏，最有可能的首发入口就是 Gemini 应用内的视频生成标签页 —— 也就是当初发现 "Powered by Omni" 字符串的同一个标签页。更广泛的访问权限大概率会通过 Gemini Advanced、Google Workspace 以及面向开发者的 Vertex AI API 陆续开放。一旦 I/O 2026 正式公布 Omni 的可用路径，本文将在 24 小时内更新。