Google DeepMind

Google DeepMind

Gemini Omni

Coming Soon

Ennå ikke offisielt utgitt av Google

Google's unified omni-model for video generation is launching soon on LoveGen AI.

Gemini Omni AI-videogenerator

Lag og rediger AI-videoer med Googles unified omni-modell

Gemini Omni er Google DeepMinds kommende unified videogenereringsmodell, først sett som en UI-streng i Gemini-appen forut for Google I/O 2026. I motsetning til de dedikerte Veo-modellene ser Gemini Omni ut til å være bygget på en enhetlig omni-arkitektur som håndterer tekst, bilde, video og lyd i ett system. Basert på lekkede demoer støtter den nativt synkronisert lyd og chattbasert videoredigering — eksakte spesifikasjoner bekreftes ved offisiell kunngjøring.

Gemini Omni ble oppdaget som en UI-streng i Gemini-appen i mai 2026, bare dager før Google I/O 2026 (planlagt til 19.–20. mai). Google har ikke offisielt kunngjort modellen, og all informasjon nedenfor er basert på lekkede demoer og UI-strenger snarere enn offisiell dokumentasjon. Spesifikasjoner, priser og tilgjengelighet bekreftes ved offisiell utgivelse.

Fra tilgjengelige lekkasjer ser modellen ut til å støtte chattbasert videoredigering som en førsteklasses funksjon. Brukere ser ut til å kunne beskrive endringer på naturlig språk — for eksempel fjerne et vannmerke, bytte ett objekt mot et annet eller skrive om en hel scene — og modellen anvender redigeringen uten manuelt bilde-for-bilde-arbeid. Lekket demomateriale inkluderte en scene med to menn som spiser spaghetti på en luksusrestaurant og en professor som skriver matematiske bevis på en tavle mens han forteller.

Nativt synkronisert lyd ser ut til å bli produsert i ett enkelt gjennomløp: dialog med leppesynkronisering, lydeffekter på skjermen og bakgrunnsambient — alt sammen uten et separat TTS- eller Foley-etterbehandlingstrinn. Et bibliotek med ferdiglagde maler for hurtigstart var også synlig i den lekkede app-UI-en.

Alle tekniske spesifikasjoner — inkludert oppløsning, varighet, bildefrekvens, bildeforhold og priser — er ikke offisielt bekreftet og vil bli kunngjort. LoveGen AI integrerer Gemini Omni så snart API-et blir offentlig tilgjengelig.

Slik bruker du Gemini Omni

01

Trinn 1: Velg opprettelsesmodus

Velg tekst til video for generering fra en prompt, bilde til video for å animere et referansebilde, eller velg en ferdiglagd mal for hurtigstart.

02

Trinn 2: Beskriv videoen eller redigeringen

Skriv en detaljert prompt eller beskriv en redigering på vanlig språk — Gemini Omni forstår naturlige språklige sceneendringer, objektutskiftninger og stiljusteringer via chat.

03

Trinn 3: Generer og forfin

Klikk på Generer. Gemini Omni returnerer en video med nativt synkronisert lyd. Bruk chattredigereren til å finjustere spesifikke elementer uten å starte på nytt.

Tekniske spesifikasjoner for Gemini Omni

LeverandørGoogle DeepMind
ArkitekturUnified omni-modell (tekst + bilde + video + lyd) — bekreftes ved offisiell kunngjøring
Nåværende statusIkke offisielt kunngjort — sett i lekket UI, mai 2026
Forventet kunngjøringGoogle I/O 2026 (19.–20. mai 2026)
InndatamoduserTekst til video, Bilde til video, Chattbasert redigering (basert på lekkede demoer — TBD)
VideoredigeringVia chat: objektutskifting, fjerning av vannmerker, omskriving av scener (basert på lekkede demoer — TBD)
MalerBibliotek med ferdiglagde maler (basert på lekket UI — TBD)
Nativ lydDialog (leppesynkronisering), SFX, ambient bakgrunnslyd i ett gjennomløp (basert på lekkede demoer — TBD)
OppløsningTBD — bekreftes ved offisiell utgivelse
Varighet / FPS / PriserTBD — bekreftes ved offisiell utgivelse

Hvorfor Gemini Omni skiller seg ut

Unified omni-modellarkitektur

Gemini Omni ser ut til å være den første Google-videomodellen bygget på en unified omni-arkitektur — én modell håndterer tekst, bilde, video og lyd i ett enkelt gjennomløp, noe som eliminerer sømmene mellom modaliteter som separate pipeline-modeller introduserer. Arkitekturdetaljer bekreftes offisielt.

Chattbasert videoredigering

Basert på lekkede demoer kan du beskrive endringer på vanlig språk, og Gemini Omni anvender dem direkte — fjern et vannmerke, bytt et objekt, skriv om en scene. Ingen tidslinjescrubbing eller bilde-for-bilde-redigering kreves. Funksjonsdetaljer bekreftes ved offisiell utgivelse.

Nativt synkronisert lyd i ett enkelt gjennomløp

Lekkede demoer viser dialog med leppesynkronisering, lydeffekter på skjermen og ambient bakgrunnslyd produsert sammen med videoen i ett enkelt fremoverpasset — intet separat TTS- eller Foley-trinn. Bekreftede spesifikasjoner kunngjøres offisielt.

Gemini Omni vs andre AI-videogeneratorer

FeatureGemini OmniVeo 3.1Sora 2Grok Imagine
LeverandørGoogle DeepMindGoogle DeepMindOpenAIxAI
ArkitekturUnified omni-modell (TBD)DiffusjonDiffusjonAurora (autoregressiv)
Chattbasert redigeringJa (per lekkede demoer)NeiNeiNei
Maks. oppløsningTBD1080p1080p720p
Nativ lydJa (per lekkede demoer)JaJaJa
BildeinputTBDOpptil 3 bilder1 bilde + Cameos1 bilde
MalerJa (per lekket UI)NeiNeiNei
TilgjengelighetKommer snartTilgjengeligTilgjengeligTilgjengelig

Forventede bruksområder for skapere, redaktører og historiefortellere

01

Chattbasert videoredigering

Basert på lekkede demoer kan du hoppe over tidslinjeredaktøren og beskrive ønsket endring — fjern et element, bytt et objekt, endre innstillingen — og Gemini Omni anvender det direkte via naturlig språk.

02

Malbasert innhold for sosiale medier

Basert på den lekkede UI-en kan du velge en ferdiglagd mal, sette inn prompten din og få en fullt sammensatt video med lyd — ingen produksjonserfaring kreves. Fulle maldetaljer bekreftes ved offisiell utgivelse.

03

Opprettelse av dialogscener

Generer realistiske samtalesscener med nøyaktig leppesynkronisering og ambient lyd i ett enkelt gjennomløp — ideelt for markedsføringsskript, utdanningsinnhold eller kortfilmdialog.

04

Bildeanimasjon med lyd

Last opp et foto eller en illustrasjon og animer det med en prompt. Gemini Omni legger til bevegelse og synkroniserte lydeffekter uten et separat lydverktøy.

05

Scenestoryboarding

Visualiser raskt manusbeats som korte klipp med nativ lyd. Bruk chattredigereren til å justere innramming eller dialog mellom opptak uten å regenerere fra bunnen av.

06

Merkevarevideo-produksjon

Bruk maler for rask merkevarevideo-produksjon og forfin deretter med chattbasert redigering — bytt elementer eller juster tonen slik at den samsvarer med merkevarens stemme.

Utforsk relaterte AI-videogeneratorer

Vanlige spørsmål om Gemini Omni

Hva er Gemini Omni?

Gemini Omni er Google DeepMinds kommende videogenereringsmodell, først sett som en UI-streng i Gemini-appen forut for Google I/O 2026. Det ser ut til å være en unified omni-modell som håndterer tekst, bilde, video og lyd i ett system, med nativt synkronisert lyd og chattbasert videoredigering. Alle detaljer bekreftes ved den offisielle kunngjøringen.

Hvordan skiller Gemini Omni seg fra Veo 3.1?

Veo 3.1 er en dedikert videodiffusjonsmodell med kjente, dokumenterte spesifikasjoner. Gemini Omni ser ut til å være bygget på en unified omni-arkitektur — én modell håndterer tekst, bilde, video og lyd i ett enkelt gjennomløp, tilsvarende GPT-4o. Dette muliggjør chattbasert redigering og malbasert opprettelse som Veo 3.1 ikke tilbyr. Eksakte arkitekturdetaljer bekreftes offisielt.

Hva er chattbasert videoredigering i Gemini Omni?

Basert på lekkede demoer lar Gemini Omni deg beskrive redigeringer på vanlig språk — for eksempel: 'fjern vannmerket', 'bytt den røde koppen med en kaffekopp', eller 'skriv om denne scenen slik at karakteren er ute'. Modellen anvender redigeringen uten manuelt bilde-for-bilde-arbeid. Denne funksjonen er ikke offisielt bekreftet, og detaljer kan endres.

Genererer Gemini Omni synkronisert lyd?

Basert på lekkede demoer ser Gemini Omni ut til å produsere nativt synkronisert lyd — inkludert dialog med leppesynkronisering, lydeffekter synkronisert med handlinger på skjermen og ambient bakgrunnslyd — i ett enkelt fremoverpasset. Dette er ikke offisielt bekreftet, og full spesifikasjon kunngjøres på Google I/O 2026.

Når er Gemini Omni tilgjengelig på LoveGen AI?

Gemini Omni ble sett i et lekket UI forut for Google I/O 2026 (19.–20. mai 2026). Google har ennå ikke offisielt kunngjort priser, et API eller en tilgjengelighetsdato. LoveGen AI integrerer det så snart API-et blir offentlig tilgjengelig.

Hvilke videomaler inkluderer Gemini Omni?

Et bibliotek med ferdiglagde maler var synlig i den lekkede Gemini-app-UI-en. Maler ser ut til automatisk å håndtere komposisjon, tempo og lyd for hurtig videoopprettelse. Fulle detaljer — inkludert antall maler og kategorier — bekreftes ved den offisielle kunngjøringen.