Google DeepMind

Gemini Omni

Kommer snart

Offentlig API rulles ut i ukene etter Google I/O 2026

Gemini Omni Flash ble lansert 19. mai 2026. LoveGen AI legger det til så snart det offentlige Vertex AI API-et er tilgjengelig.

Published May 12, 2026Updated May 12, 2026

Gemini Omni Flash AI-videogenerator

Lag og rediger AI-videoer med Googles unified omni-modell

Gemini Omni Flash er Google DeepMinds nye unified videogenereringsmodell, kunngjort og lansert på Google I/O 2026 den 19. mai 2026. I motsetning til de dedikerte Veo-modellene er Gemini Omni Flash bygget på en enkelt transformerbasert omni-arkitektur som nativt aksepterer tekst-, bilde-, lyd- og videoinput og produserer høyoppløsningsvideo med synkronisert lyd i ett gjennomløp. Den støtter samtaledrevet flerstegs redigering — endre kameravinkelen, bytt objekter, omskriv scener, eller endre bakgrunner ved hjelp av prompter på naturlig språk.

Gemini Omni ble avduket på Google I/O 2026, der den første shippingvarianten — Gemini Omni Flash — ble rullet ut samme dag (19. mai 2026). Google beskriver den som en modell som kan lage hva som helst fra hvilken som helst input, begynner med video, og kombinerer Geminis resonnering med generative medier for sterkere verdensforståelse, multimodalitet og redigering.

Ved lansering produserer Gemini Omni Flash 10-sekunders høyoppløsningsklipp kombinert med nativt synkronisert lyd — dialog med leppesynkronisering, lydeffekter timet til handlinger på skjermen og ambient bakgrunn — alt generert i ett enkelt fremoverpasset. Google har bekreftet at 10-sekundersgrensen er en distribusjonsbeslutning og ikke en modellbegrensning. Forbedret forståelse av fysikk, inkludert tyngdekraft, kinetisk energi og fluiddynamikk, gir mer realistisk bevegelse.

Hovedtrekket ved lansering er samtaledrevet flerstegs redigering. Når du har et klipp, beskriver du endringer på naturlig språk — «flytt kameravinkelen til venstre», «lag skulpturen av bobler», «når personen rører speilet, la det bølge som en væske» — og Omni redigerer det målrettede elementet mens resten holdes intakt. Referansestabling lar deg kombinere et karakterbilde, en lydfil og en stilreferanse i én enkelt prompt, og malbasert oppretting med énklikks-applikasjon er innebygd i Gemini-appen og Google Flow.

Gemini Omni Flash rulles ut globalt til Google AI Plus-, Pro- og Ultra-abonnenter gjennom Gemini-appen og Google Flow, og uten kostnad for brukere 18+ i YouTube Shorts Remix og YouTube Create-appen. Hvert generert videoklipp har et umerkelig SynthID-vannmerke pluss C2PA Content Credentials. Offentlig utvikler- og enterprise-API-tilgang via Vertex AI rulles ut i ukene etter I/O; LoveGen AI vil integrere Gemini Omni Flash så snart det API-et er offentlig tilgjengelig.

Slik bruker du Gemini Omni Flash

Trinn 1: Velg opprettelsesmodus

Generer fra en tekstprompt, animer et bilde, bland flere referanser (bilde, lyd, stil), eller velg en innebygd mal for énklikks-oppretting.

Trinn 2: Beskriv videoen eller redigeringen

Skriv en detaljert prompt eller beskriv en redigering på naturlig språk — Gemini Omni Flash forstår kamerabevegelser, objektutskiftninger, bakgrunnsendringer og stils kift via chat.

Trinn 3: Generer og forfin

Klikk på Generer. Gemini Omni Flash returnerer et 10-sekunders høyoppløsningsklipp med nativt synkronisert lyd. Bruk flerstegs chat til å raffinere spesifikke elementer uten å starte på nytt.

Tekniske spesifikasjoner for Gemini Omni Flash

Leverandør	Google DeepMind
Utgivelsesdato	19. mai 2026 (Google I/O 2026)
Variant	Gemini Omni Flash (første shippingmodell i Omni-familien)
Arkitektur	Unified transformerbasert omni-modell (tekst + bilde + lyd + video inn → video + lyd ut)
Inndatamoduser	Tekst, bilde, lyd, video — inkludert multi-referansestabling
Utdata	Høyoppløsningsvideo med nativt synkronisert lyd
Maks. varighet	10 sekunder per klipp (distribusjonsbegrensning, ikke modellbegrensning)
Nativ lyd	Dialog (leppesynkronisering), SFX, ambient — generert i ett gjennomløp
Redigering	Samtaledrevet flerstegs — kamera, bakgrunner, objekter, handlinger, stil
Fysikk	Forbedret tyngdekraft, kinetisk energi og fluiddynamikk
Opphav	SynthID-vannmerke + C2PA Content Credentials (obligatorisk)
Tilgjengelighet	Gemini-appen og Google Flow (AI Plus/Pro/Ultra); YouTube Shorts Remix og Create-appen (gratis, 18+)
API-tilgang	Offentlig Vertex AI API rulles ut i ukene etter I/O 2026

Hvorfor Gemini Omni Flash skiller seg ut

Unified omni-modellarkitektur

Gemini Omni Flash er Googles første shippingvideomodell bygget på en unified transformerbasert omni-arkitektur — én modell som håndterer tekst, bilde, lyd og video i ett enkelt gjennomløp, noe som eliminerer sømmene mellom modaliteter som separate pipeline-systemer introduserer. Referansestabling lar deg kombinere et karakterbilde, en lydfil og en stilreferanse i én enkelt prompt.

Samtaledrevet flerstegs redigering

Beskriv endringer på naturlig språk og Gemini Omni Flash anvender dem direkte — flytt kameraet, bytt et objekt, skriv om en scene, eller endre en bakgrunn — mens resten av klippet holdes intakt. Redigeringer over flere runder bygger på tidligere kontekst slik at du kan iterere uten å starte på nytt.

Nativt synkronisert lyd + forbedret fysikk

Dialog med leppesynkronisering, lydeffekter på skjermen og ambient bakgrunnslyd produseres sammen med videoen i ett enkelt fremoverpasset — uten eget TTS- eller Foley-trinn. Forbedret forståelse av tyngdekraft, kinetisk energi og fluiddynamikk gir mer realistisk bevegelse, og hvert resultat har SynthID- og C2PA-opphav.

Gemini Omni Flash vs andre AI-videogeneratorer

Feature	Gemini Omni Flash	Veo 3.1	Sora 2	Grok Imagine
Leverandør	Google DeepMind	Google DeepMind	OpenAI	xAI
Arkitektur	Unified transformerbasert omni-modell	Diffusjon	Diffusjon	Aurora (autoregressiv)
Samtaledrevet redigering	Ja — flerstegs	Nei	Nei	Nei
Maks. oppløsning	Høy oppløsning	1080p	1080p	720p
Maks. varighet	10 sek. (distribusjonsbegrensning)	8 sek. (kan utvides)	20 sek.	15 sek.
Nativ lyd	Ja — ett gjennomløp	Ja	Ja	Ja
Inndatamoduser	Tekst, bilde, lyd, video	Tekst, bilde (opptil 3)	Tekst, bilde + Cameos	Tekst, 1 bilde
Maler	Ja	Nei	Nei	Nei
Opphav	SynthID + C2PA	SynthID	C2PA	—
Tilgjengelighet	Gemini-appen, Flow, YouTube	Tilgjengelig	Tilgjengelig	Tilgjengelig

Hva du kan bygge med Gemini Omni Flash

Samtaledrevet videoredigering

Hopp helt over tidslinjeredaktøren — beskriv ønsket endring på naturlig språk og Gemini Omni Flash anvender det direkte. Endre kameravinkler, bytt objekter, endre bakgrunner, eller skriv om en hel handling med én enkelt prompt.

Malbasert innhold for sosiale medier

Velg en innebygd mal, skriv inn prompten din, og få et fullt sammensatt 10-sekunders klipp med synkronisert lyd — laget for YouTube Shorts, Reels og TikTok-formater uten produksjonserfaring.

Opprettelse av dialogscener

Generer realistiske samtalescener med nøyaktig leppesynkronisering og ambient lyd i ett enkelt gjennomløp — ideelt for markedsføringsskript, utdanningsinnhold eller kortfilmdialog.

Referansestabler-generering

Kombiner et karakterbilde, en lydfil og en stilreferanse i én enkelt prompt for å generere konsekvente karakterer som matcher et bestemt utseende, stemme og estetikk på tvers av klipp.

Scene-storyboarding

Visualiser raskt manusbeats som korte klipp med nativ lyd. Bruk flerstegs chat-redigering til å justere innramming, bytte objekter, eller skrive om handlinger på tvers av opptak uten å regenerere fra bunnen av.

Merkevarevideo-produksjon

Bruk maler for rask merkevarevideoproduksjon og forfin deretter med samtaledrevet redigering — bytt produktbilder, endre bakgrunner, eller juster den visuelle tonen for å matche merkevaren din.

Utforsk relaterte AI-videogeneratorer

Veo 3.1

Google DeepMinds 1080p-videomodell med bilder-til-video og nativ lydgenerering.

Sora 2

OpenAIs filmiske videogenerator med fysisk presis bevegelse og 20 sekunders varighet.

Grok Imagine

xAIs Aurora-motor videomodell med Fun/Normal/Spicy-stilmoduser og nativ lyd.

Happy Horse 1.0

AI-videogenerator nr. 1 med filmisk bevegelse og leppesynkronisering på 7 språk.

Seedance 2.0

ByteDances videomodell med nettsøkintegrasjon og synkronisert lyd.

Kling 3.0

4K-video av regissørkvalitet med multi-shot AI-kinematografi og nativt lyd.

Vanlige spørsmål om Gemini Omni Flash

Hva er Gemini Omni Flash?

Gemini Omni Flash er Google DeepMinds nye unified videogenereringsmodell, kunngjort og lansert på Google I/O 2026 den 19. mai 2026. Det er den første shippingmodellen i Gemini Omni-familien — bygget på en enkelt transformerbasert omni-arkitektur som nativt håndterer tekst-, bilde-, lyd- og videoinput og produserer høyoppløsningsvideo med synkronisert lyd i ett enkelt gjennomløp. Nøkkelfunksjoner inkluderer samtaledrevet flerstegs redigering, forbedret fysikkforståelse og referansestabling.

Hvordan skiller Gemini Omni Flash seg fra Veo 3.1?

Veo 3.1 er en dedikert videodiffusjonsmodell som utelukkende fokuserer på tekst- og bilde-til-video. Gemini Omni Flash er bygget på en unified transformerbasert omni-arkitektur — én modell som håndterer tekst, bilde, lyd og video i ett enkelt gjennomløp, konseptuelt likt GPT-4o — og knytter videogenerering til Geminis resonnering. Det åpner for samtaledrevet flerstegs redigering, referansestabling og malbasert oppretting som Veo 3.1 ikke tilbyr. Veo 3.1 gir for øyeblikket lengre klipp og rikere flerbildekontroll.

Hva er samtaledrevet redigering i Gemini Omni Flash?

Når du har et klipp, beskriver du endringer på naturlig språk — «flytt kameravinkelen til venstre», «lag skulpturen av bobler», «bytt den røde koppen med en kaffekopp», eller «skriv om denne scenen så karakteren er ute» — og Gemini Omni Flash redigerer det målrettede elementet mens resten holdes intakt. Redigeringer over flere runder bygger på tidligere kontekst slik at du kan iterere uten å starte på nytt. Lydediting på eksisterende videoer holdes bevisst tilbake ved lansering.

Genererer Gemini Omni Flash synkronisert lyd?

Ja. Gemini Omni Flash produserer nativt synkronisert lyd — dialog med leppesynkronisering, lydeffekter timet til handlinger på skjermen og ambient bakgrunn — i ett enkelt fremoverpasset sammen med videoen, uten eget TTS- eller Foley-trinn. All generert utdata tagges automatisk med et SynthID-vannmerke og C2PA Content Credentials.

Når er Gemini Omni Flash tilgjengelig på LoveGen AI?

Gemini Omni Flash ble lansert 19. mai 2026 i Gemini-appen, Google Flow, YouTube Shorts Remix og YouTube Create-appen. Offentlig utvikler- og enterprise-API-tilgang via Vertex AI rulles ut i ukene etter Google I/O 2026. LoveGen AI integrerer Gemini Omni Flash så snart det API-et er offentlig tilgjengelig.

Hvilke videomaler inkluderer Gemini Omni Flash?

Gemini Omni Flash leveres med malbasert videooppretting som kan brukes med ett klikk i Gemini-appen og Google Flow. Maler håndterer komposisjon, tempo og lyd for rask generering, og en tilpasset AI-avatar-opprettelsesflyt er også tilgjengelig. Den gjeldende malkatalogen finnes i Gemini-appen og Flow-produktflatene.