·12 min read·AuthorLoveGen AI

Gemini Omni 完整爆料:Google I/O 2026 前的所有泄露信息

Gemini Omni 是 Google 一款尚未公布的视频生成产品代号,于 2026 年 5 月 2 日泄露于 Gemini 应用,距离 I/O 2026 仅剩八天。

Gemini Omni 完整爆料:Google I/O 2026 前的所有泄露信息

Gemini Omni 完整爆料:Google I/O 2026 前的所有泄露信息

Gemini Omni 是一款尚未正式发布的 Google 视频生成产品代号,于 2026 年 5 月 2 日 出现在 Gemini 应用的 UI 中,距离 Google I/O 2026(5 月 19–20 日开幕)仅剩八天。目前公开可证实的证据只有一条泄露字符串 ——"Start with an idea or try a template. Powered by Omni."—— 由 TestingCatalog 在 Gemini 的视频生成标签页中发现并曝光。截至 2026 年 5 月 11 日,Google 尚未对 Omni 作出任何官方确认。

本文将在 Google 官方公布任何相关信息后的 24 小时内更新。

Gemini Omni 是什么?

截至 2026 年 5 月 11 日,Gemini Omni 只是一个存在于 Google 内部预发布代码中的产品名称。没有规格、没有演示、没有模型卡,也没有 Google 的官方宣传材料。"Omni" 这个名称暗示着多模态能力 —— 可能涵盖图像、视频,乃至音频于一体 —— 但 Google 既未公开、也未泄露任何技术细节。除那条 UI 字符串以外的一切,都只是分析师的推断。

这次泄露之所以值得关注,是因为 Omni 与 "Toucan" 并列出现 ——Toucan 是 Gemini 现有视频生成入口的内部代号,目前由 Veo 3.1 提供支持。在现有产品名称旁边预先放置一个新的公开产品名称,是 Google 在正式发布前 1–2 周替换底层引擎或重新命名前端入口的标准做法。

泄露的内容是什么,从何而来

Gemini 应用中发现的"Powered by Omni"UI 字符串

这次泄露的信息量不大,但来源异常清晰。以下是公开可验证的内容,以及不可验证的部分。

精确的 UI 字符串

2026 年 5 月 2 日,一张 Gemini 应用视频生成标签页的截图浮出水面,其中包含这样一行文字:"Start with an idea or try a template. Powered by Omni." TestingCatalog 当天发布了这张截图,WaveSpeed 紧接着在 5 月 3 日发布了分析文章。

这段字符串在此前任何公开版本的 Gemini 中都未曾出现。截至本文发布之时,它仍仅存在于测试环境中 —— 大多数用户在生产环境的 Gemini 应用中看不到它。

这能证明的是:Google 已经将一个新的产品名称 ——"Omni"—— 推入了一个涉及消费级 Gemini UI 的构建管线。但这无法证明:Omni 是一个新模型、它能做到任何 Veo 3.1 做不到的事,也无法证明它会在 Google I/O 2026 上面向公众发布。

Toucan 是什么,Omni 又如何与之并列

"Toucan" 是 Gemini 现有视频生成标签页的内部代号 —— 也就是用户今天在 Gemini 应用中生成视频片段时看到的那个入口。Toucan 当前由 Veo 3.1 驱动,后者是 Google 目前部署的旗舰视频模型。Toucan 此前也是通过类似的 UI 字符串考古发现的,它本身并不是一个模型。

在 2026 年 5 月 2 日的泄露中,"Omni" 出现在了与 Toucan 引用相同的 UI 区域内。正是这种并置关系,让此次泄露从"一段随机字符串"升级为"即将到来的产品发布"。Google 替换消费级模型的标准流程,是在正式宣布前 1–2 周将新产品名推入代码,进行并行预发布,然后在主题演讲当天完成切换。

Omni 的三种合理解读

自 5 月 2 日以来,业内分析对 Omni 究竟是什么的讨论,已经收敛到三种相互竞争的解读。这三种解读中,没有任何一种得到官方确认。

解读一 —— Veo 流水线的品牌重塑

Omni 是同一个 Veo 驱动后端的新消费级产品名称。实际生成仍由 Toucan/Veo 3.1 完成,只是更换了标签。这是干扰最小的解读,也能解释 Google 为何没有提前向媒体做风声 —— 因为没有新技术需要预热。支持证据:Google 一直在向消费友好、抽象掉底层模型的产品命名方式靠拢 ——"Toucan" 本身就从未作为面向用户的标签出现过。

解读二 —— Gemini 自研的新视频模型

Omni 是在 Gemini 体系内训练的全新视频模型,与 Veo 并行存在。在这种解读下,Veo 仍然是面向企业的 Vertex AI / Google Cloud 产品,而 Omni 成为 Gemini 应用中的消费级支柱。这能解释 "Omni" 这个名称 —— 它指向模型本身,而非一个包装层 —— 并且符合 Google 一贯保持消费与企业模型双轨并行的历史。

解读三 —— 图像、视频、音频统一的全模态模型

Omni 是 Gemini 自研全新模型家族的首个成员,能够在单次前向推理中同时完成图像生成、视频生成和同步音频。这是最具野心的解读:它意味着一个模型将同时取代 Gemini 内当前的 Veo 视频流水线和 Nano Banana Pro 图像栈。"omni" 这一名称是这种解读最有力的依据,但目前没有任何泄露明确支持同步音频或图像+视频统一 —— 这完全是从名称本身做出的推断。

Gemini Omni 何时发布?

Google I/O 2026 主题演讲期待

最有可能的发布窗口是 Google I/O 2026,即 2026 年 5 月 19–20 日 —— 距离本文发布仅八天。Google 已确认 Gemini 和 AI 更新进入主题演讲议程。过往 Gemini 发布中观察到的 1–2 周预发布模式,使主题演讲当天揭晓成为可能性最高的结果。

相邻的泄露也支持 I/O 发布的判断。曝光 "Omni" 的同一轮 UI 排查,也曝光了对 "Gemini 3.2" 和 "Gemini 3.5" 的引用(@pankajkumar_dev,2026 年 5 月 3 日)—— 意味着 Google 可能将 Omni 作为更广泛的 Gemini 3.2 / 3.5 模型发布中的视频生成支柱一并推出。

不过这种判断有两点不可忽视的风险:(1) Google 此前也曾出现过 UI 字符串预先泄露、但产品比最初泄露时间晚 1–3 个月才落地的情况;(2) "Powered by Omni" 也可能始终是一个仅存在于开发版本中的标签,即便 I/O 当天面向消费者的实际放量仍然只覆盖一小部分用户。今天能站得住脚的说法是:I/O 2026 公布是最可能的结果 —— 但并非确定无疑。

Omni 在竞品格局中的位置

Gemini Omni vs Veo、Sora、Seedance 竞品格局

由于 Omni 没有公开的基准测试、能力清单或样例输出,任何关于质量的对比都只能是猜测。但状态和结构性定位是可以对比的 —— 也就是各家在 2026 年 5 月的视频生成版图中分别占据什么位置。

模型状态(2026 年 5 月 11 日)原生音频公开最长片段时长当前可在何处试用
Gemini Omni已泄露,未公布传闻有,未确认未知暂未开放
Veo 3.1(Toucan)已在 Gemini 上线,同时在 Vertex AI支持配合场景延伸约 15 秒lovegen.ai/zh/veo3-1
Sora 2自 2025 年起上线支持可变,支持编辑Sora 应用、lovegen.ai
Seedance 2已上线,当前公开榜单领跑者支持视套餐而定lovegen.ai

现阶段真正起决定作用的,是分发能力。 截至 2026 年 5 月,Seedance 2.0 领跑公开视频生成基准,但主要通过专门工具触达创作者;Sora 2 凭借独立应用获得消费级触达。如果 Omni 在 Gemini 应用内上线,它将默认继承 Gemini 现有的消费用户基数。无论其原始输出质量是否能跻身第一梯队,这都是 Omni 最有可能产生影响的维度。

已知信息 vs. 未知信息

这则报道里最重要的背景,就是泄露已证实的事实与分析师外推之间的差距。在 I/O 2026 之前,请把右侧标注 "推测" 的内容当作流言对待。

论断状态来源
Gemini 构建管线中存在一个名为 "Omni" 的产品已证实TestingCatalog,2026 年 5 月 2 日
泄露 UI 字符串为 "Start with an idea or try a template. Powered by Omni."已证实@testingcatalog 推文
Omni 出现在 Gemini 视频生成标签页中,与 Toucan 并列已证实TestingCatalog
Toucan 目前由 Veo 3.1 驱动已证实TestingCatalog
Omni 是新模型(而非 Veo 的品牌重塑)推测WaveSpeed 分析
Omni 在单一模型中处理图像 + 视频 + 音频推测基于 "Omni" 名称的推断
Omni 生成同步空间音频推测未注明来源的流言
Omni 性能优于 Veo 3.1推测TestingCatalog 推测性表述
Omni 将在 Google I/O 2026(5 月 19–20 日)发布报道中 / 较有可能预发布模式推断加 I/O 议程
Omni 与 Gemini 3.2 或 3.5 配套发布报道中@pankajkumar_dev,2026 年 5 月 3 日
定价、可用层级、区域放量节奏未知暂无泄露

I/O 2026 之前,创作者该怎么做

本文发布与 I/O 主题演讲之间只剩八天,时间很短,但确实存在。三种读者场景 —— 三种不同的答案。

如果你正在用 Veo 3.1 做项目

在 Veo 3.1 上把项目做完。不要因为 Omni 可能在 I/O 推出就暂停手头的工作。两个原因。第一,即便按最乐观的解读(主题演讲当天发布新模型),Omni 的首发放量也很可能仅限一小部分用户,要达到普遍可用可能还需要数周。第二,你在 Veo 3.1 上积累的提示词技巧,可以直接迁移到 Gemini 家族任何后续模型 ——Google 在 Veo 各代之间的提示词语法保持了相当的稳定性。

如果你正在 Sora 2、Seedance 2 之间选型,或者考虑等待

如果你的交付节点在 30 天以外,再等一周看 I/O 公告几乎没有成本 —— 而那场公告会对决策产生实质影响。如果你在七天内就要交付,今天站得住脚的选项是 Seedance 2(当前榜单领跑者)或 Sora 2(消费级流程最成熟)。仅凭一句 "Powered by Omni",还不足以作为生产环境承诺的依据。

如果你用 Nano Banana Pro 做图像 + 视频组合

Gemini 当前的图像+视频工作流由两个模型组成:Nano Banana Pro 负责图像,Veo 3.1 负责视频。如果解读三成立,Omni 是一个统一的全模态模型,你的工作流将变得更简单 —— 一个模型搞定两件事。但在 I/O 确认之前,请把目前的 Nano Banana Pro → Veo 3.1 衔接路径视为受支持的方案,不要基于推测重构生产管线。

常见问题

Gemini Omni 是什么?

Gemini Omni 是一款尚未正式发布的 Google 视频生成产品代号,于 2026 年 5 月 2 日出现在 Gemini 应用的 UI 中。目前公开可证实的证据只有一条字符串 ——"Start with an idea or try a template. Powered by Omni."—— 出现在视频生成标签页中。截至 2026 年 5 月 11 日,Google 尚未正式公布 Omni,但它与 Toucan(Gemini 现有的、由 Veo 3.1 驱动的视频工具)的并列出现,暗示它正在为 Google I/O 2026 的发布做最后准备。

Gemini Omni 是否已经被官方公布?

没有。截至 2026 年 5 月 11 日,Google 没有就 Gemini Omni 作任何官方表态。唯一的公开证据,是 TestingCatalog 于 2026 年 5 月 2 日曝光的一次 UI 字符串泄露。除泄露字符串以外的任何功能描述 —— 同步音频、更高分辨率、图像+视频统一 —— 都属于分析师的推测,而非 Google 的声明。

Gemini Omni 什么时候发布?

最有可能的发布窗口是 Google I/O 2026,举办时间为 2026 年 5 月 19–20 日 —— 即本文发布后八天。Google 已确认 Gemini 与 AI 更新进入主题演讲议程。为期两周左右的预发布字符串布置,是一种标准的发布前模式,但没有任何 Google 官方信源确认 Omni 一定会出现在 I/O 上。延后到其他时点公布的可能性也无法排除。

Omni 会取代 Gemini 中的 Veo 3.1 吗?

可能会,但尚未得到确认。泄露的 UI 显示 Omni 出现在 "Toucan" 旁边,而 Toucan 是 Gemini 内部对现有 Veo 3.1 驱动视频工具的代号。在现有产品名旁边放置一个新名称,是替换前的典型预发布模式 —— 但 Google 也可能继续将 Veo 保留为 Vertex AI / Cloud 端的企业产品,同时把 Gemini 端面向消费者的体验重新命名为 Omni。

Gemini 里的 Toucan 是什么?

Toucan 是 Gemini 当前视频生成工具的内部代号 —— 也就是用户今天在 Gemini 应用中生成由 Veo 3.1 驱动的视频片段时所看到的那个标签页。Toucan 此前同样是通过类似的 UI 字符串泄露被发现的,它本身并不是一个独立于 Veo 的模型。2026 年 5 月的泄露发现 "Omni" 出现在与 "Toucan" 同一 UI 区域,暗示着平行存在或替换的关系。

Gemini Omni 也会做图像生成吗?

未知。泄露的 UI 字符串只提到视频生成。但 "Omni" 这一名称本身暗示了多模态能力 —— 图像、视频,乃至音频于一体 —— 这将与 Google 目前由 Nano Banana 2 和 Nano Banana Pro 负责图像生成的安排有明显不同。"统一的全模态模型" 是分析师提出的三种合理解读之一,但目前没有任何信息得到确认。

Gemini Omni 与 Sora 2 相比如何?

直接对比并不可能,因为 Omni 没有公开的基准测试、没有公开输出、也没有得到确认的能力清单。相比之下,Sora 2 自 2025 年起向公众开放,已经具备得到验证的片段长度、音频支持和编辑控件。今天最站得住脚的判断是:如果 Omni 在 I/O 2026 上发布,它将是 Google 至今为止针对 Sora 2 在消费市场推出的最严肃回应。

Gemini Omni 与 Seedance 2.0 相比如何?

截至 2026 年 5 月,字节跳动的 Seedance 2.0 在公开视频生成基准上处于领先位置。Omni 没有基准数据,任何质量层面的对比都只是推测。结构性差异在于分发:Seedance 2.0 是面向创作者的 API + 应用产品;而 Omni 如果在 Gemini 应用内发布,将默认触达 Gemini 现有的消费用户基础 —— 这个分发面比 Seedance 当前掌握的要宽得多。

Omni 会生成同步音频吗?

同步音频是 Omni 最被频繁讨论的功能,但既未被 Google 确认,也未在泄露的 UI 字符串中出现。这个流言一部分来自 "Omni" 名称本身(暗示多模态),一部分来自分析师外推。如果 Omni 真的内建同步音频,它将弥补 Google 视频输出与 Sora 2 之间最常被提及的差距 ——Sora 2 自上线起就支持音视频同步。

Omni 与 Gemini 3.2 或 3.5 有关吗?

可能有关。曝光 "Omni" 的同一轮 UI 排查,也曝光了对 Gemini 3.2 和 Gemini 3.5 的引用,意味着下一代 Gemini 模型正在与 Omni 一同进入预发布阶段。今天最站得住脚的判断是:Google 可能在 I/O 2026 上将 Omni 作为更广泛的 Gemini 3.2 / 3.5 发布中的视频生成支柱推出。具体的配套关系尚未得到确认。

我以后要怎么试用 Gemini Omni?

如果参考过往 Google 的发布节奏,最有可能的首发入口就是 Gemini 应用内的视频生成标签页 —— 也就是当初发现 "Powered by Omni" 字符串的同一个标签页。更广泛的访问权限大概率会通过 Gemini Advanced、Google Workspace 以及面向开发者的 Vertex AI API 陆续开放。一旦 I/O 2026 正式公布 Omni 的可用路径,本文将在 24 小时内更新。

gemini omnigoogle geminiai video generationgoogle io 2026veo 3.1gemini leaksai news