Google DeepMind

Google DeepMind

Gemini Omni

Coming Soon

Non ancora rilasciato ufficialmente da Google

Google's unified omni-model for video generation is launching soon on LoveGen AI.

Generatore video IA Gemini Omni

Crea e modifica video IA con il modello omni unificato di Google

Gemini Omni è il prossimo modello di generazione video unificato di Google DeepMind, individuato per la prima volta in una stringa dell'interfaccia trapelata dell'app Gemini prima di Google I/O 2026. A differenza dei modelli Veo dedicati, Gemini Omni sembra essere costruito su un'architettura omni singola che gestisce testo, immagine, video e audio in un sistema unificato. Secondo le demo trapelate, supporta audio sincronizzato nativo e modifica video tramite chat — le specifiche esatte sono soggette all'annuncio ufficiale.

Gemini Omni è stato scoperto come stringa dell'interfaccia all'interno dell'app Gemini nel maggio 2026, pochi giorni prima di Google I/O 2026 (previsto per il 19–20 maggio). Google non ha ancora annunciato ufficialmente il modello, e tutte le informazioni seguenti si basano su demo e stringhe dell'interfaccia trapelate, non su documentazione ufficiale. Specifiche, prezzi e disponibilità sono soggetti all'annuncio ufficiale.

Secondo le demo trapelate, il modello sembra supportare la modifica video tramite chat come funzionalità principale. Gli utenti sembrano poter descrivere le modifiche in linguaggio naturale — rimuovere una filigrana, sostituire un oggetto, riscrivere una scena — e il modello applica la modifica senza lavoro manuale fotogramma per fotogramma. Le demo trapelate mostravano due uomini che mangiano spaghetti in un ristorante di lusso e un professore che scrive dimostrazioni matematiche alla lavagna spiegandole.

L'audio sincronizzato nativo sembra essere prodotto in un unico passaggio: dialogo con sincronizzazione labiale, effetti sonori sincronizzati con l'azione sullo schermo e audio ambientale di sottofondo, tutto senza una fase separata di post-elaborazione TTS o Foley. Nell'interfaccia trapelata era visibile anche una libreria di template predefiniti per la creazione rapida.

Tutte le specifiche tecniche — risoluzione, durata, frequenza fotogrammi, formati e prezzi — non sono ufficialmente confermate e sono soggette al rilascio. LoveGen AI integrerà Gemini Omni non appena l'API sarà disponibile pubblicamente.

Come usare Gemini Omni

01

Passo 1: Scegli la modalità di creazione

Seleziona testo a video per generare da un prompt, immagine a video per animare un'immagine di riferimento, oppure scegli un template predefinito per iniziare rapidamente.

02

Passo 2: Descrivi il tuo video o la modifica

Scrivi un prompt dettagliato o descrivi una modifica in linguaggio naturale — Gemini Omni comprende i cambiamenti di scena, le sostituzioni di oggetti e le regolazioni di stile tramite chat.

03

Passo 3: Genera e raffina

Clicca su Genera. Gemini Omni restituisce un video con audio sincronizzato nativo. Usa l'editor di chat per affinare elementi specifici senza ricominciare da capo.

Specifiche tecniche di Gemini Omni

FornitoreGoogle DeepMind
ArchitetturaModello omni unificato (testo + immagine + video + audio) — soggetto a conferma ufficiale
Stato attualeNon ancora annunciato ufficialmente — individuato in interfaccia trapelata nel maggio 2026
Annuncio previstoGoogle I/O 2026 (19–20 maggio 2026)
Modalità di inputTesto a video, immagine a video, modifica tramite chat (secondo demo trapelate — TBD)
Modifica videoTramite chat: sostituzione oggetti, rimozione filigrana, riscrittura scene (secondo demo trapelate — TBD)
TemplateLibreria di template predefiniti (secondo interfaccia trapelata — TBD)
Audio nativoDialogo (sincronizzazione labiale), effetti sonori, audio ambientale in un unico passaggio (secondo demo trapelate — TBD)
RisoluzioneTBD — soggetto al rilascio ufficiale
Durata / FPS / PrezzoTBD — soggetto al rilascio ufficiale

Perché Gemini Omni si distingue

Architettura modello omni unificato

Gemini Omni sembra essere il primo modello video di Google costruito su un'architettura omni unificata — un modello che gestisce la generazione di testo, immagine, video e audio in un unico passaggio, eliminando le giunture tra modalità che i modelli a pipeline separata lasciano. I dettagli dell'architettura sono soggetti a conferma ufficiale.

Modifica video tramite chat

Secondo le demo trapelate, puoi descrivere modifiche in linguaggio naturale e Gemini Omni le applica direttamente — rimuovere filigrane, sostituire oggetti, riscrivere scene — senza scrubbing della timeline o modifica fotogramma per fotogramma. I dettagli delle funzionalità sono soggetti al rilascio ufficiale.

Audio sincronizzato nativo in un unico passaggio

Le demo trapelate mostrano dialogo con sincronizzazione labiale, effetti sonori sincronizzati con lo schermo e audio ambientale generati insieme al video in un unico passaggio in avanti — senza fase TTS o Foley separata. Specifiche confermate soggette all'annuncio ufficiale.

Gemini Omni vs altri generatori video IA

FeatureGemini OmniVeo 3.1Sora 2Grok Imagine
FornitoreGoogle DeepMindGoogle DeepMindOpenAIxAI
ArchitetturaOmni unificato (TBD)DiffusioneDiffusioneAurora (autoregressivo)
Modifica tramite chatSì (secondo demo trapelate)NoNoNo
Risoluzione massimaTBD1080p1080p720p
Audio nativoSì (secondo demo trapelate)
Input immagineTBDFino a 3 immagini1 immagine + Cameos1 immagine
TemplateSì (secondo interfaccia trapelata)NoNoNo
DisponibilitàProssimamenteDisponibileDisponibileDisponibile

Utilizzi attesi per creatori, editor e narratori

01

Modifica video tramite chat

Secondo le demo trapelate, senza editor della timeline: descrivi la modifica che vuoi — rimuovere un elemento, sostituire un oggetto, cambiare l'ambientazione — e Gemini Omni la applica direttamente in linguaggio naturale.

02

Contenuto social basato su template

Secondo l'interfaccia trapelata, scegli un template predefinito, inserisci un prompt e ottieni un video completo con audio per TikTok, Reels o Shorts — senza esperienza produttiva. Dettagli soggetti al rilascio ufficiale.

03

Creazione di scene di dialogo

Genera scene di conversazione realistiche con sincronizzazione labiale precisa e audio ambientale in un unico passaggio — ideale per script di marketing, contenuti educativi o dialoghi di cortometraggi.

04

Animazione di immagini con audio

Carica una foto o un'illustrazione e animala con un prompt. Gemini Omni aggiunge movimento ed effetti sonori sincronizzati senza uno strumento audio separato.

05

Storyboarding di scene

Visualizza rapidamente le scene di uno script come clip brevi con audio nativo. Usa l'editor di chat per regolare inquadratura o dialogo tra le riprese senza rigenerare da zero.

06

Produzione video di brand

Usa i template per creare rapidamente video di brand, poi affina con la modifica tramite chat — sostituisci elementi o adatta il tono alla voce del tuo brand.

Esplora generatori video IA correlati

Domande frequenti su Gemini Omni

Cos'è Gemini Omni?

Gemini Omni è il prossimo modello di generazione video di Google DeepMind, individuato per la prima volta in una stringa dell'interfaccia trapelata dell'app Gemini prima di Google I/O 2026. Sembra essere un modello omni unificato che gestisce testo, immagine, video e audio in un sistema, con audio sincronizzato nativo e modifica video tramite chat. Tutti i dettagli sono soggetti all'annuncio ufficiale.

In cosa si differenzia Gemini Omni da Veo 3.1?

Veo 3.1 è un modello di diffusione video dedicato con specifiche note e documentate. Gemini Omni sembra essere costruito su un'architettura omni unificata — un modello che elabora testo, immagine, video e audio in un unico passaggio, simile nel concetto a GPT-4o. Ciò consentirebbe la modifica tramite chat e la creazione basata su template che Veo 3.1 non offre. I dettagli dell'architettura sono soggetti a conferma ufficiale.

Cos'è la modifica video tramite chat in Gemini Omni?

Secondo le demo trapelate, Gemini Omni consente di descrivere modifiche in linguaggio naturale — ad esempio, rimuovere la filigrana, sostituire la tazza rossa con una tazza da caffè, o riscrivere questa scena in modo che il personaggio sia all'aperto. Il modello applica la modifica senza lavoro manuale fotogramma per fotogramma. Questa funzione non è ancora confermata ufficialmente e i dettagli possono cambiare.

Gemini Omni genera audio sincronizzato?

Secondo le demo trapelate, Gemini Omni sembra generare audio sincronizzato nativo in un unico passaggio — incluso dialogo con sincronizzazione labiale, effetti sonori sincronizzati con l'azione sullo schermo e audio ambientale di sottofondo. Ciò non è ancora confermato ufficialmente e le specifiche complete sono soggette all'annuncio di Google I/O 2026.

Quando sarà disponibile Gemini Omni su LoveGen AI?

Gemini Omni è stato individuato in un'interfaccia trapelata prima di Google I/O 2026 (19–20 maggio 2026). Google non ha ancora annunciato ufficialmente prezzi, API o date di disponibilità. LoveGen AI lo integrerà non appena l'API sarà disponibile pubblicamente.

Quali template video include Gemini Omni?

Una libreria di template predefiniti era visibile nell'interfaccia trapelata dell'app Gemini. I template sembrano gestire automaticamente composizione, ritmo e audio per una creazione video rapida. I dettagli completi — inclusi numero e categorie di template — sono soggetti all'annuncio ufficiale.