
Google DeepMind
Gemini Omni
Offentlig API rulles ut i ukene etter Google I/O 2026
Gemini Omni Flash ble lansert 19. mai 2026. LoveGen AI legger det til så snart det offentlige Vertex AI API-et er tilgjengelig.
Gemini Omni Flash AI-videogenerator
Lag og rediger AI-videoer med Googles unified omni-modell
Gemini Omni Flash er Google DeepMinds nye unified videogenereringsmodell, kunngjort og lansert på Google I/O 2026 den 19. mai 2026. I motsetning til de dedikerte Veo-modellene er Gemini Omni Flash bygget på en enkelt transformerbasert omni-arkitektur som nativt aksepterer tekst-, bilde-, lyd- og videoinput og produserer høyoppløsningsvideo med synkronisert lyd i ett gjennomløp. Den støtter samtaledrevet flerstegs redigering — endre kameravinkelen, bytt objekter, omskriv scener, eller endre bakgrunner ved hjelp av prompter på naturlig språk.
Gemini Omni ble avduket på Google I/O 2026, der den første shippingvarianten — Gemini Omni Flash — ble rullet ut samme dag (19. mai 2026). Google beskriver den som en modell som kan lage hva som helst fra hvilken som helst input, begynner med video, og kombinerer Geminis resonnering med generative medier for sterkere verdensforståelse, multimodalitet og redigering.
Ved lansering produserer Gemini Omni Flash 10-sekunders høyoppløsningsklipp kombinert med nativt synkronisert lyd — dialog med leppesynkronisering, lydeffekter timet til handlinger på skjermen og ambient bakgrunn — alt generert i ett enkelt fremoverpasset. Google har bekreftet at 10-sekundersgrensen er en distribusjonsbeslutning og ikke en modellbegrensning. Forbedret forståelse av fysikk, inkludert tyngdekraft, kinetisk energi og fluiddynamikk, gir mer realistisk bevegelse.
Hovedtrekket ved lansering er samtaledrevet flerstegs redigering. Når du har et klipp, beskriver du endringer på naturlig språk — «flytt kameravinkelen til venstre», «lag skulpturen av bobler», «når personen rører speilet, la det bølge som en væske» — og Omni redigerer det målrettede elementet mens resten holdes intakt. Referansestabling lar deg kombinere et karakterbilde, en lydfil og en stilreferanse i én enkelt prompt, og malbasert oppretting med énklikks-applikasjon er innebygd i Gemini-appen og Google Flow.
Gemini Omni Flash rulles ut globalt til Google AI Plus-, Pro- og Ultra-abonnenter gjennom Gemini-appen og Google Flow, og uten kostnad for brukere 18+ i YouTube Shorts Remix og YouTube Create-appen. Hvert generert videoklipp har et umerkelig SynthID-vannmerke pluss C2PA Content Credentials. Offentlig utvikler- og enterprise-API-tilgang via Vertex AI rulles ut i ukene etter I/O; LoveGen AI vil integrere Gemini Omni Flash så snart det API-et er offentlig tilgjengelig.
Slik bruker du Gemini Omni Flash
Trinn 1: Velg opprettelsesmodus
Generer fra en tekstprompt, animer et bilde, bland flere referanser (bilde, lyd, stil), eller velg en innebygd mal for énklikks-oppretting.
Trinn 2: Beskriv videoen eller redigeringen
Skriv en detaljert prompt eller beskriv en redigering på naturlig språk — Gemini Omni Flash forstår kamerabevegelser, objektutskiftninger, bakgrunnsendringer og stils kift via chat.
Trinn 3: Generer og forfin
Klikk på Generer. Gemini Omni Flash returnerer et 10-sekunders høyoppløsningsklipp med nativt synkronisert lyd. Bruk flerstegs chat til å raffinere spesifikke elementer uten å starte på nytt.
Tekniske spesifikasjoner for Gemini Omni Flash
| Leverandør | Google DeepMind |
| Utgivelsesdato | 19. mai 2026 (Google I/O 2026) |
| Variant | Gemini Omni Flash (første shippingmodell i Omni-familien) |
| Arkitektur | Unified transformerbasert omni-modell (tekst + bilde + lyd + video inn → video + lyd ut) |
| Inndatamoduser | Tekst, bilde, lyd, video — inkludert multi-referansestabling |
| Utdata | Høyoppløsningsvideo med nativt synkronisert lyd |
| Maks. varighet | 10 sekunder per klipp (distribusjonsbegrensning, ikke modellbegrensning) |
| Nativ lyd | Dialog (leppesynkronisering), SFX, ambient — generert i ett gjennomløp |
| Redigering | Samtaledrevet flerstegs — kamera, bakgrunner, objekter, handlinger, stil |
| Fysikk | Forbedret tyngdekraft, kinetisk energi og fluiddynamikk |
| Opphav | SynthID-vannmerke + C2PA Content Credentials (obligatorisk) |
| Tilgjengelighet | Gemini-appen og Google Flow (AI Plus/Pro/Ultra); YouTube Shorts Remix og Create-appen (gratis, 18+) |
| API-tilgang | Offentlig Vertex AI API rulles ut i ukene etter I/O 2026 |
Hvorfor Gemini Omni Flash skiller seg ut
Unified omni-modellarkitektur
Gemini Omni Flash er Googles første shippingvideomodell bygget på en unified transformerbasert omni-arkitektur — én modell som håndterer tekst, bilde, lyd og video i ett enkelt gjennomløp, noe som eliminerer sømmene mellom modaliteter som separate pipeline-systemer introduserer. Referansestabling lar deg kombinere et karakterbilde, en lydfil og en stilreferanse i én enkelt prompt.
Samtaledrevet flerstegs redigering
Beskriv endringer på naturlig språk og Gemini Omni Flash anvender dem direkte — flytt kameraet, bytt et objekt, skriv om en scene, eller endre en bakgrunn — mens resten av klippet holdes intakt. Redigeringer over flere runder bygger på tidligere kontekst slik at du kan iterere uten å starte på nytt.
Nativt synkronisert lyd + forbedret fysikk
Dialog med leppesynkronisering, lydeffekter på skjermen og ambient bakgrunnslyd produseres sammen med videoen i ett enkelt fremoverpasset — uten eget TTS- eller Foley-trinn. Forbedret forståelse av tyngdekraft, kinetisk energi og fluiddynamikk gir mer realistisk bevegelse, og hvert resultat har SynthID- og C2PA-opphav.
Gemini Omni Flash vs andre AI-videogeneratorer
| Feature | Gemini Omni Flash | Veo 3.1 | Sora 2 | Grok Imagine |
|---|---|---|---|---|
| Leverandør | Google DeepMind | Google DeepMind | OpenAI | xAI |
| Arkitektur | Unified transformerbasert omni-modell | Diffusjon | Diffusjon | Aurora (autoregressiv) |
| Samtaledrevet redigering | Ja — flerstegs | Nei | Nei | Nei |
| Maks. oppløsning | Høy oppløsning | 1080p | 1080p | 720p |
| Maks. varighet | 10 sek. (distribusjonsbegrensning) | 8 sek. (kan utvides) | 20 sek. | 15 sek. |
| Nativ lyd | Ja — ett gjennomløp | Ja | Ja | Ja |
| Inndatamoduser | Tekst, bilde, lyd, video | Tekst, bilde (opptil 3) | Tekst, bilde + Cameos | Tekst, 1 bilde |
| Maler | Ja | Nei | Nei | Nei |
| Opphav | SynthID + C2PA | SynthID | C2PA | — |
| Tilgjengelighet | Gemini-appen, Flow, YouTube | Tilgjengelig | Tilgjengelig | Tilgjengelig |
Hva du kan bygge med Gemini Omni Flash
Samtaledrevet videoredigering
Hopp helt over tidslinjeredaktøren — beskriv ønsket endring på naturlig språk og Gemini Omni Flash anvender det direkte. Endre kameravinkler, bytt objekter, endre bakgrunner, eller skriv om en hel handling med én enkelt prompt.
Malbasert innhold for sosiale medier
Velg en innebygd mal, skriv inn prompten din, og få et fullt sammensatt 10-sekunders klipp med synkronisert lyd — laget for YouTube Shorts, Reels og TikTok-formater uten produksjonserfaring.
Opprettelse av dialogscener
Generer realistiske samtalescener med nøyaktig leppesynkronisering og ambient lyd i ett enkelt gjennomløp — ideelt for markedsføringsskript, utdanningsinnhold eller kortfilmdialog.
Referansestabler-generering
Kombiner et karakterbilde, en lydfil og en stilreferanse i én enkelt prompt for å generere konsekvente karakterer som matcher et bestemt utseende, stemme og estetikk på tvers av klipp.
Scene-storyboarding
Visualiser raskt manusbeats som korte klipp med nativ lyd. Bruk flerstegs chat-redigering til å justere innramming, bytte objekter, eller skrive om handlinger på tvers av opptak uten å regenerere fra bunnen av.
Merkevarevideo-produksjon
Bruk maler for rask merkevarevideoproduksjon og forfin deretter med samtaledrevet redigering — bytt produktbilder, endre bakgrunner, eller juster den visuelle tonen for å matche merkevaren din.
Utforsk relaterte AI-videogeneratorer

Veo 3.1
Google DeepMinds 1080p-videomodell med bilder-til-video og nativ lydgenerering.

Sora 2
OpenAIs filmiske videogenerator med fysisk presis bevegelse og 20 sekunders varighet.

Grok Imagine
xAIs Aurora-motor videomodell med Fun/Normal/Spicy-stilmoduser og nativ lyd.
Happy Horse 1.0
AI-videogenerator nr. 1 med filmisk bevegelse og leppesynkronisering på 7 språk.

Seedance 2.0
ByteDances videomodell med nettsøkintegrasjon og synkronisert lyd.
Kling 3.0
4K-video av regissørkvalitet med multi-shot AI-kinematografi og nativt lyd.
Vanlige spørsmål om Gemini Omni Flash
Hva er Gemini Omni Flash?
Gemini Omni Flash er Google DeepMinds nye unified videogenereringsmodell, kunngjort og lansert på Google I/O 2026 den 19. mai 2026. Det er den første shippingmodellen i Gemini Omni-familien — bygget på en enkelt transformerbasert omni-arkitektur som nativt håndterer tekst-, bilde-, lyd- og videoinput og produserer høyoppløsningsvideo med synkronisert lyd i ett enkelt gjennomløp. Nøkkelfunksjoner inkluderer samtaledrevet flerstegs redigering, forbedret fysikkforståelse og referansestabling.
Hvordan skiller Gemini Omni Flash seg fra Veo 3.1?
Veo 3.1 er en dedikert videodiffusjonsmodell som utelukkende fokuserer på tekst- og bilde-til-video. Gemini Omni Flash er bygget på en unified transformerbasert omni-arkitektur — én modell som håndterer tekst, bilde, lyd og video i ett enkelt gjennomløp, konseptuelt likt GPT-4o — og knytter videogenerering til Geminis resonnering. Det åpner for samtaledrevet flerstegs redigering, referansestabling og malbasert oppretting som Veo 3.1 ikke tilbyr. Veo 3.1 gir for øyeblikket lengre klipp og rikere flerbildekontroll.
Hva er samtaledrevet redigering i Gemini Omni Flash?
Når du har et klipp, beskriver du endringer på naturlig språk — «flytt kameravinkelen til venstre», «lag skulpturen av bobler», «bytt den røde koppen med en kaffekopp», eller «skriv om denne scenen så karakteren er ute» — og Gemini Omni Flash redigerer det målrettede elementet mens resten holdes intakt. Redigeringer over flere runder bygger på tidligere kontekst slik at du kan iterere uten å starte på nytt. Lydediting på eksisterende videoer holdes bevisst tilbake ved lansering.
Genererer Gemini Omni Flash synkronisert lyd?
Ja. Gemini Omni Flash produserer nativt synkronisert lyd — dialog med leppesynkronisering, lydeffekter timet til handlinger på skjermen og ambient bakgrunn — i ett enkelt fremoverpasset sammen med videoen, uten eget TTS- eller Foley-trinn. All generert utdata tagges automatisk med et SynthID-vannmerke og C2PA Content Credentials.
Når er Gemini Omni Flash tilgjengelig på LoveGen AI?
Gemini Omni Flash ble lansert 19. mai 2026 i Gemini-appen, Google Flow, YouTube Shorts Remix og YouTube Create-appen. Offentlig utvikler- og enterprise-API-tilgang via Vertex AI rulles ut i ukene etter Google I/O 2026. LoveGen AI integrerer Gemini Omni Flash så snart det API-et er offentlig tilgjengelig.
Hvilke videomaler inkluderer Gemini Omni Flash?
Gemini Omni Flash leveres med malbasert videooppretting som kan brukes med ett klikk i Gemini-appen og Google Flow. Maler håndterer komposisjon, tempo og lyd for rask generering, og en tilpasset AI-avatar-opprettelsesflyt er også tilgjengelig. Den gjeldende malkatalogen finnes i Gemini-appen og Flow-produktflatene.
