
Google DeepMind
Gemini Omni
Offentligt API ruller ud i ugerne efter Google I/O 2026
Gemini Omni Flash blev lanceret den 19. maj 2026. LoveGen AI tilføjer det, så snart det offentlige Vertex AI API ruller ud.
Gemini Omni Flash AI-videogenerator
Opret og rediger AI-videoer med Googles unified omni-model
Gemini Omni Flash er Google DeepMinds nye unified videogenereringsmodel, annonceret og lanceret på Google I/O 2026 den 19. maj 2026. I modsætning til de dedikerede Veo-modeller er Gemini Omni Flash bygget på en enkelt transformer-baseret omni-arkitektur, der nativt accepterer tekst-, billede-, lyd- og videoinput og producerer video i høj opløsning med synkroniseret lyd i ét enkelt gennemløb. Den understøtter samtalebaseret multi-runde redigering — skift kameravinkel, byt objekter ud, omskriv scener eller modificer baggrunde ved hjælp af prompts på almindeligt sprog.
Gemini Omni blev præsenteret på Google I/O 2026, med den første udgivne variant — Gemini Omni Flash — der begyndte at rulle ud samme dag (19. maj 2026). Google beskriver det som en model, der kan skabe alt fra ethvert input, startende med video, og som kombinerer Geminis ræsonnering med generative medier for stærkere verdensforståelse, multimodalitet og redigering.
Ved lanceringen producerer Gemini Omni Flash 10-sekunders klip i høj opløsning kombineret med nativt synkroniseret lyd — dialog med læbesynkronisering, lydeffekter der er timet til handlinger på skærmen og ambient baggrundslyd — alt genereret i et enkelt fremadrettet gennemløb. Google har bekræftet, at 10-sekunders grænsen er en deployment-beslutning snarere end en modelbestramsning. Forbedret forståelse af fysik, herunder tyngdekraft, kinetisk energi og fluiddynamik, giver mulighed for mere realistisk bevægelse.
Hovedlanceringsfunktionen er samtalebaseret multi-runde redigering. Når du har et klip, beskriver du ændringer på almindeligt sprog — "flyt kameravinklen til venstre", "lav skulpturen af bobler", "når personen rører spejlet, få det til at riple som flydende" — og Omni bearbejder det målrettede element, mens resten bevares intakt. Reference stacking lader dig kombinere et karakterbillede, en lydfil og en stilreference i én enkelt prompt, og skabelonbaseret oprettelse med ét-klik-anvendelse er indbygget i Gemini-appen og Google Flow.
Gemini Omni Flash rulles globalt ud til Google AI Plus-, Pro- og Ultra-abonnenter via Gemini-appen og Google Flow, og gratis til brugere 18+ i YouTube Shorts Remix og YouTube Create-appen. Alle genererede videoer bærer et umærkeligt SynthID-vandmærke plus C2PA Content Credentials. Offentlig udvikler- og enterprise-API-adgang via Vertex AI rulles ud i ugerne efter I/O; LoveGen AI vil integrere Gemini Omni Flash, så snart det API bliver offentligt tilgængeligt.
Sådan bruger du Gemini Omni Flash
Trin 1: Vælg din oprettelsestilstand
Generer fra en tekstprompt, animer et billede, bland flere referencer (billede, lyd, stil), eller vælg en indbygget skabelon til ét-klik-oprettelse.
Trin 2: Beskriv din video eller redigering
Skriv en detaljeret prompt eller beskriv en redigering på almindeligt sprog — Gemini Omni Flash forstår kamerabevægelser, objektudskiftninger, baggrundsændringer og stilskift via chat.
Trin 3: Generer og forfin
Klik på Generer. Gemini Omni Flash returnerer et 10-sekunders klip i høj opløsning med nativt synkroniseret lyd. Brug multi-runde chat til at forfine specifikke elementer uden at starte forfra.
Tekniske specifikationer for Gemini Omni Flash
| Udbyder | Google DeepMind |
| Udgivelsesdato | 19. maj 2026 (Google I/O 2026) |
| Variant | Gemini Omni Flash (første udgivne model i Omni-familien) |
| Arkitektur | Unified transformer-baseret omni-model (tekst + billede + lyd + video input → video + lyd output) |
| Inputtilstande | Tekst, billede, lyd, video — herunder multi-reference stacking |
| Output | Video i høj opløsning med nativt synkroniseret lyd |
| Maks. varighed | 10 sekunder pr. klip (deployment-grænse, ikke modelbestramsning) |
| Nativ lyd | Dialog (læbesynkronisering), SFX, ambient — genereret i ét enkelt gennemløb |
| Redigering | Samtalebaseret multi-runde — kamera, baggrunde, objekter, handlinger, stil |
| Fysik | Forbedret tyngdekraft, kinetisk energi og fluiddynamik |
| Herkomst | SynthID-vandmærke + C2PA Content Credentials (obligatorisk) |
| Tilgængelighed | Gemini-app & Google Flow (AI Plus/Pro/Ultra); YouTube Shorts Remix & Create-app (gratis, 18+) |
| API-adgang | Offentligt Vertex AI API ruller ud i ugerne efter I/O 2026 |
Hvorfor Gemini Omni Flash skiller sig ud
Unified omni-modelarkitektur
Gemini Omni Flash er Googles første udgivne videomodel bygget på en unified transformer-baseret omni-arkitektur — én model der håndterer tekst, billede, lyd og video i ét enkelt gennemløb, hvilket eliminerer sammenføjningerne mellem modaliteter, som separate pipeline-systemer introducerer. Reference stacking lader dig kombinere et karakterbillede, en lydfil og en stilreference i én enkelt prompt.
Samtalebaseret multi-runde redigering
Beskriv ændringer på almindeligt sprog, og Gemini Omni Flash anvender dem direkte — flyt kameraet, byt et objekt ud, omskriv en scene eller skift en baggrund — mens resten af klippet bevares intakt. Multi-runde redigeringer bygger på tidligere kontekst, så du kan iterere uden at starte forfra.
Nativt synkroniseret lyd + forbedret fysik
Dialog med læbesynkronisering, lydeffekter på skærmen og ambient baggrundslyd produceres sammen med videoen i ét enkelt fremadrettet gennemløb — intet separat TTS- eller Foley-trin. Forbedret forståelse af tyngdekraft, kinetisk energi og fluiddynamik giver mere realistisk bevægelse, og hvert output bærer SynthID- og C2PA-herkomst.
Gemini Omni Flash vs andre AI-videogeneratorer
| Feature | Gemini Omni Flash | Veo 3.1 | Sora 2 | Grok Imagine |
|---|---|---|---|---|
| Udbyder | Google DeepMind | Google DeepMind | OpenAI | xAI |
| Arkitektur | Unified transformer omni-model | Diffusion | Diffusion | Aurora (autoregressiv) |
| Samtalebaseret redigering | Ja — multi-runde | Nej | Nej | Nej |
| Maks. opløsning | Høj opløsning | 1080p | 1080p | 720p |
| Maks. varighed | 10s (deployment-grænse) | 8s (kan forlænges) | 20s | 15s |
| Nativ lyd | Ja — ét enkelt gennemløb | Ja | Ja | Ja |
| Inputtilstande | Tekst, billede, lyd, video | Tekst, billede (op til 3) | Tekst, billede + Cameos | Tekst, 1 billede |
| Skabeloner | Ja | Nej | Nej | Nej |
| Herkomst | SynthID + C2PA | SynthID | C2PA | — |
| Tilgængelighed | Gemini-app, Flow, YouTube | Tilgængelig | Tilgængelig | Tilgængelig |
Hvad du kan bygge med Gemini Omni Flash
Samtalebaseret videoredigering
Spring tidslinjeredaktøren helt over — beskriv den ønskede ændring på almindeligt sprog, og Gemini Omni Flash anvender den direkte. Skift kameravinkler, byt objekter ud, skift baggrunde eller omskriv en hel handling med én enkelt prompt.
Skabelonbaseret indhold til sociale medier
Vælg en indbygget skabelon, indsæt din prompt og få et fuldt sammensat 10-sekunders klip med synkroniseret lyd — designet til YouTube Shorts-, Reels- og TikTok-formater uden produktionserfaring kræves.
Oprettelse af dialogscener
Generer realistiske samtalescener med præcis læbesynkronisering og ambient lyd i ét enkelt gennemløb — ideelt til markedsføringsscripts, uddannelsesindhold eller kortfilmdialog.
Reference-stacked generering
Kombiner et karakterbillede, en lydfil og en stilreference i én enkelt prompt for at generere konsistente karakterer, der matcher et specifikt udseende, en stemme og en æstetik på tværs af klip.
Scenestoryboarding
Visualiser hurtigt manusbeats som korte klip med nativ lyd. Brug multi-runde chаt-redigering til at justere indramning, bytte objekter ud eller omskrive handlinger på tværs af optagelser uden at regenerere fra grunden.
Brandvideoproduktion
Brug skabeloner til hurtig branded videooprettelse og forfin derefter med samtalebaseret redigering — byt produktbilleder ud, skift baggrunde eller juster den visuelle tone, så den matcher dit brand.
Udforsk relaterede AI-videogeneratorer

Veo 3.1
Google DeepMinds 1080p-videomodel med billeder-til-video og nativ lydgenerering.

Sora 2
OpenAIs filmiske videogenerator med fysisk præcis bevægelse og 20 sekunders varighed.

Grok Imagine
xAI's Aurora-motor videomodel med Fun/Normal/Spicy-stiltilstande og nativ lyd.
Happy Horse 1.0
AI-videogenerator nr. 1 med filmisk bevægelse og læbesynkronisering på 7 sprog.

Seedance 2.0
ByteDances videomodel med websøgningsintegration og synkroniseret lyd.
Kling 3.0
4K-video af instruktørkvalitet med multi-shot AI-cinematografi og nativt lyd.
Ofte stillede spørgsmål om Gemini Omni Flash
Hvad er Gemini Omni Flash?
Gemini Omni Flash er Google DeepMinds nye unified videogenereringsmodel, annonceret og lanceret på Google I/O 2026 den 19. maj 2026. Det er den første udgivne model i Gemini Omni-familien — bygget på en enkelt transformer-baseret omni-arkitektur, der nativt håndterer tekst-, billede-, lyd- og videoinput og producerer video i høj opløsning med synkroniseret lyd i ét enkelt gennemløb. Fremhævede funktioner inkluderer samtalebaseret multi-runde redigering, forbedret fysikforståelse og reference stacking.
Hvordan adskiller Gemini Omni Flash sig fra Veo 3.1?
Veo 3.1 er en dedikeret videodiffusionsmodel, der udelukkende fokuserer på tekst- og billede-til-video. Gemini Omni Flash er bygget på en unified transformer-baseret omni-arkitektur — én model der håndterer tekst, billede, lyd og video i ét enkelt gennemløb, konceptuelt lignende GPT-4o — og knytter videogenerering til Geminis ræsonnering. Det muliggør samtalebaseret multi-runde redigering, reference stacking og skabelondrevet oprettelse, som Veo 3.1 ikke tilbyder. Veo 3.1 tilbyder i øjeblikket længere klip og rigere multi-billed-inputkontrol.
Hvad er samtalebaseret redigering i Gemini Omni Flash?
Når du har et klip, beskriver du ændringer på almindeligt sprog — "flyt kameravinklen til venstre", "lav skulpturen af bobler", "byt den røde kop ud med en kaffekop" eller "omskriv denne scene, så karakteren er udenfor" — og Gemini Omni Flash bearbejder det målrettede element, mens resten bevares intakt. Multi-runde redigeringer bygger på tidligere kontekst, så du kan iterere uden at starte forfra. Redigering af lyd på eksisterende videoer tilbageholdes bevidst ved lanceringen.
Genererer Gemini Omni Flash synkroniseret lyd?
Ja. Gemini Omni Flash producerer nativt synkroniseret lyd — dialog med læbesynkronisering, lydeffekter timet til handlinger på skærmen og ambient baggrundslyd — i ét enkelt fremadrettet gennemløb sammen med videoen, uden separat TTS- eller Foley-trin. Alle genererede output tagges automatisk med et SynthID-vandmærke og C2PA Content Credentials.
Hvornår er Gemini Omni Flash tilgængelig på LoveGen AI?
Gemini Omni Flash blev lanceret den 19. maj 2026 inde i Gemini-appen, Google Flow, YouTube Shorts Remix og YouTube Create-appen. Offentlig udvikler- og enterprise-API-adgang via Vertex AI ruller ud i ugerne efter Google I/O 2026. LoveGen AI vil integrere Gemini Omni Flash, så snart det API bliver offentligt tilgængeligt.
Hvilke videoskabeloner inkluderer Gemini Omni Flash?
Gemini Omni Flash leveres med skabelonbaseret videooprettelse, anvendt med ét enkelt klik inde i Gemini-appen og Google Flow. Skabeloner håndterer komposition, tempo og lyd til hurtig generering, og et brugerdefineret AI-avatar-oprettelsesflow er også tilgængeligt. Det aktuelle skabelonkatalog befinder sig inde i Gemini-appen og Flow-produktfladerne.
