Google DeepMind

Google DeepMind

Gemini Omni

Coming Soon

Ainda não lançado oficialmente pelo Google

Google's unified omni-model for video generation is launching soon on LoveGen AI.

Gerador de vídeo IA Gemini Omni

Crie e edite vídeos IA com o modelo omni unificado do Google

Gemini Omni é o próximo modelo de geração de vídeo unificado do Google DeepMind, detectado pela primeira vez em uma string de UI vazada do app Gemini antes do Google I/O 2026. Ao contrário dos modelos Veo dedicados, o Gemini Omni parece ser construído em uma arquitetura omni única que processa texto, imagem, vídeo e áudio em um sistema unificado. Com base em demos vazadas, ele suporta áudio sincronizado nativo e edição de vídeo por chat — as especificações exatas estão sujeitas ao anúncio oficial.

O Gemini Omni foi descoberto como uma string de UI dentro do app Gemini em maio de 2026, dias antes do Google I/O 2026 (agendado para 19–20 de maio). O Google ainda não anunciou oficialmente o modelo, e todas as informações abaixo são baseadas em demos e strings de UI vazadas, não em documentação oficial. Especificações, preços e disponibilidade estão sujeitos ao anúncio oficial.

Segundo as demos vazadas, o modelo parece suportar edição de vídeo por chat como recurso principal. Os usuários parecem poder descrever mudanças em linguagem natural — remover uma marca d'água, trocar um objeto, reescrever uma cena — e o modelo aplica a edição sem trabalho manual quadro a quadro. As demos vazadas mostraram dois homens comendo espaguete em um restaurante sofisticado e um professor escrevendo demonstrações matemáticas em um quadro-negro enquanto as explicava.

O áudio sincronizado nativo parece ser produzido em um único passo: diálogo com sincronização labial, efeitos sonoros sincronizados com a ação na tela e áudio ambiente ao fundo, tudo sem etapa separada de pós-processamento TTS ou Foley. Na UI vazada do app também era visível uma biblioteca de templates prontos para criação rápida.

Todas as especificações técnicas — resolução, duração, taxa de quadros, proporções e preços — não são oficialmente confirmadas e estão sujeitas ao lançamento. O LoveGen AI integrará o Gemini Omni assim que a API estiver disponível publicamente.

Como usar o Gemini Omni

01

Passo 1: Escolha seu modo de criação

Selecione texto para vídeo para gerar a partir de um prompt, imagem para vídeo para animar uma imagem de referência, ou escolha um template pronto para começar rapidamente.

02

Passo 2: Descreva seu vídeo ou edição

Escreva um prompt detalhado ou descreva uma edição em linguagem natural — o Gemini Omni entende mudanças de cena, substituições de objetos e ajustes de estilo por chat.

03

Passo 3: Gere e refine

Clique em Gerar. O Gemini Omni retorna um vídeo com áudio sincronizado nativo. Use o editor de chat para refinar elementos específicos sem começar do zero.

Especificações técnicas do Gemini Omni

FornecedorGoogle DeepMind
ArquiteturaModelo omni unificado (texto + imagem + vídeo + áudio) — sujeito a confirmação oficial
Status atualSem anúncio oficial — detectado em UI vazada em maio de 2026
Anúncio esperadoGoogle I/O 2026 (19–20 de maio de 2026)
Modos de entradaTexto para vídeo, imagem para vídeo, edição por chat (com base em demos vazadas — TBD)
Edição de vídeoPor chat: substituição de objetos, remoção de marca d'água, reescrita de cenas (com base em demos vazadas — TBD)
TemplatesBiblioteca de templates prontos (com base em UI vazada — TBD)
Áudio nativoDiálogo (sincronização labial), efeitos sonoros, áudio ambiente em um único passo (com base em demos vazadas — TBD)
ResoluçãoTBD — sujeito ao lançamento oficial
Duração / FPS / PreçoTBD — sujeito ao lançamento oficial

Por que o Gemini Omni se destaca

Arquitetura de modelo omni unificado

O Gemini Omni parece ser o primeiro modelo de vídeo do Google construído em uma arquitetura omni unificada — um modelo que gerencia geração de texto, imagem, vídeo e áudio em um único passo, eliminando as costuras entre modalidades que os modelos de pipeline separados deixam. Detalhes de arquitetura sujeitos a confirmação oficial.

Edição de vídeo por chat

Com base em demos vazadas, você pode descrever mudanças em linguagem natural e o Gemini Omni as aplica diretamente — remover marcas d'água, substituir objetos, reescrever cenas — sem scrubbing de linha do tempo ou edição quadro a quadro. Detalhes de recursos sujeitos ao lançamento oficial.

Áudio sincronizado nativo em um único passo

As demos vazadas mostram diálogo com sincronização labial, efeitos sonoros sincronizados com a tela e áudio ambiente ao fundo gerados junto com o vídeo em um único passo — sem etapa TTS ou Foley separada. Especificações confirmadas sujeitas ao anúncio oficial.

Gemini Omni vs outros geradores de vídeo IA

FeatureGemini OmniVeo 3.1Sora 2Grok Imagine
FornecedorGoogle DeepMindGoogle DeepMindOpenAIxAI
ArquiteturaOmni unificado (TBD)DifusãoDifusãoAurora (autorregressivo)
Edição por chatSim (por demos vazadas)NãoNãoNão
Resolução máximaTBD1080p1080p720p
Áudio nativoSim (por demos vazadas)SimSimSim
Entrada de imagemTBDAté 3 imagens1 imagem + Cameos1 imagem
TemplatesSim (por UI vazada)NãoNãoNão
DisponibilidadeEm breveDisponívelDisponívelDisponível

Usos esperados para criadores, editores e narradores

01

Edição de vídeo por chat

Com base em demos vazadas, sem editor de linha do tempo: descreva a mudança que você quer — remover um elemento, substituir um objeto, mudar o cenário — e o Gemini Omni aplica diretamente por linguagem natural.

02

Conteúdo social baseado em templates

Com base na UI vazada, escolha um template pronto, insira um prompt e obtenha um vídeo completo com áudio para TikTok, Reels ou Shorts — sem experiência em produção. Detalhes sujeitos ao lançamento oficial.

03

Criação de cenas de diálogo

Gere cenas de conversa realistas com sincronização labial precisa e áudio ambiente em um único passo — ideal para scripts de marketing, conteúdo educacional ou diálogos de curtas-metragens.

04

Animação de imagens com áudio

Faça upload de uma foto ou ilustração e anime-a com um prompt. O Gemini Omni adiciona movimento e efeitos sonoros sincronizados sem ferramenta de áudio separada.

05

Storyboarding de cenas

Visualize rapidamente cenas de roteiro como clipes curtos com áudio nativo. Use o editor de chat para ajustar enquadramento ou diálogo entre cenas sem regenerar do zero.

06

Produção de vídeo de marca

Use templates para criar vídeos de marca rapidamente e depois refine com edição por chat — substitua elementos ou ajuste o tom para combinar com a voz da sua marca.

Explore geradores de vídeo IA relacionados

Perguntas frequentes sobre Gemini Omni

O que é Gemini Omni?

Gemini Omni é o próximo modelo de geração de vídeo do Google DeepMind, detectado pela primeira vez em uma string de UI vazada do app Gemini antes do Google I/O 2026. Parece ser um modelo omni unificado que processa texto, imagem, vídeo e áudio em um sistema, com áudio sincronizado nativo e edição de vídeo por chat. Todos os detalhes estão sujeitos ao anúncio oficial.

Como o Gemini Omni é diferente do Veo 3.1?

O Veo 3.1 é um modelo de difusão de vídeo dedicado com especificações conhecidas e documentadas. O Gemini Omni parece ser construído em uma arquitetura omni unificada — um modelo que processa texto, imagem, vídeo e áudio em um único passo, similar em conceito ao GPT-4o. Isso possibilitaria edição por chat e criação baseada em templates que o Veo 3.1 não oferece. Detalhes de arquitetura sujeitos a confirmação oficial.

O que é a edição de vídeo por chat no Gemini Omni?

Com base em demos vazadas, o Gemini Omni permite descrever edições em linguagem natural — por exemplo, remover a marca d'água, trocar a xícara vermelha por uma caneca de café, ou reescrever esta cena para que o personagem esteja ao ar livre. O modelo aplica a edição sem trabalho manual quadro a quadro. Esse recurso ainda não está confirmado oficialmente e os detalhes podem mudar.

O Gemini Omni gera áudio sincronizado?

Com base em demos vazadas, o Gemini Omni parece gerar áudio sincronizado nativo em um único passo — incluindo diálogo com sincronização labial, efeitos sonoros sincronizados com a ação na tela e áudio ambiente ao fundo. Isso ainda não está confirmado oficialmente e as especificações completas estão sujeitas ao anúncio do Google I/O 2026.

Quando o Gemini Omni estará disponível no LoveGen AI?

O Gemini Omni foi detectado em uma UI vazada antes do Google I/O 2026 (19–20 de maio de 2026). O Google ainda não anunciou oficialmente preços, API ou data de disponibilidade. O LoveGen AI o integrará assim que a API estiver disponível publicamente.

Quais templates de vídeo o Gemini Omni inclui?

Uma biblioteca de templates prontos era visível na UI vazada do app Gemini. Os templates parecem lidar automaticamente com composição, ritmo e áudio para criação rápida de vídeo. Os detalhes completos — incluindo número e categorias de templates — estão sujeitos ao anúncio oficial.