Google DeepMind

Gemini Omni

Kommer snart

Offentligt API ruller ud i ugerne efter Google I/O 2026

Gemini Omni Flash blev lanceret den 19. maj 2026. LoveGen AI tilføjer det, så snart det offentlige Vertex AI API ruller ud.

Published May 12, 2026Updated May 12, 2026

Gemini Omni Flash AI-videogenerator

Opret og rediger AI-videoer med Googles unified omni-model

Gemini Omni Flash er Google DeepMinds nye unified videogenereringsmodel, annonceret og lanceret på Google I/O 2026 den 19. maj 2026. I modsætning til de dedikerede Veo-modeller er Gemini Omni Flash bygget på en enkelt transformer-baseret omni-arkitektur, der nativt accepterer tekst-, billede-, lyd- og videoinput og producerer video i høj opløsning med synkroniseret lyd i ét enkelt gennemløb. Den understøtter samtalebaseret multi-runde redigering — skift kameravinkel, byt objekter ud, omskriv scener eller modificer baggrunde ved hjælp af prompts på almindeligt sprog.

Gemini Omni blev præsenteret på Google I/O 2026, med den første udgivne variant — Gemini Omni Flash — der begyndte at rulle ud samme dag (19. maj 2026). Google beskriver det som en model, der kan skabe alt fra ethvert input, startende med video, og som kombinerer Geminis ræsonnering med generative medier for stærkere verdensforståelse, multimodalitet og redigering.

Ved lanceringen producerer Gemini Omni Flash 10-sekunders klip i høj opløsning kombineret med nativt synkroniseret lyd — dialog med læbesynkronisering, lydeffekter der er timet til handlinger på skærmen og ambient baggrundslyd — alt genereret i et enkelt fremadrettet gennemløb. Google har bekræftet, at 10-sekunders grænsen er en deployment-beslutning snarere end en modelbestramsning. Forbedret forståelse af fysik, herunder tyngdekraft, kinetisk energi og fluiddynamik, giver mulighed for mere realistisk bevægelse.

Hovedlanceringsfunktionen er samtalebaseret multi-runde redigering. Når du har et klip, beskriver du ændringer på almindeligt sprog — "flyt kameravinklen til venstre", "lav skulpturen af bobler", "når personen rører spejlet, få det til at riple som flydende" — og Omni bearbejder det målrettede element, mens resten bevares intakt. Reference stacking lader dig kombinere et karakterbillede, en lydfil og en stilreference i én enkelt prompt, og skabelonbaseret oprettelse med ét-klik-anvendelse er indbygget i Gemini-appen og Google Flow.

Gemini Omni Flash rulles globalt ud til Google AI Plus-, Pro- og Ultra-abonnenter via Gemini-appen og Google Flow, og gratis til brugere 18+ i YouTube Shorts Remix og YouTube Create-appen. Alle genererede videoer bærer et umærkeligt SynthID-vandmærke plus C2PA Content Credentials. Offentlig udvikler- og enterprise-API-adgang via Vertex AI rulles ud i ugerne efter I/O; LoveGen AI vil integrere Gemini Omni Flash, så snart det API bliver offentligt tilgængeligt.

Sådan bruger du Gemini Omni Flash

Trin 1: Vælg din oprettelsestilstand

Generer fra en tekstprompt, animer et billede, bland flere referencer (billede, lyd, stil), eller vælg en indbygget skabelon til ét-klik-oprettelse.

Trin 2: Beskriv din video eller redigering

Skriv en detaljeret prompt eller beskriv en redigering på almindeligt sprog — Gemini Omni Flash forstår kamerabevægelser, objektudskiftninger, baggrundsændringer og stilskift via chat.

Trin 3: Generer og forfin

Klik på Generer. Gemini Omni Flash returnerer et 10-sekunders klip i høj opløsning med nativt synkroniseret lyd. Brug multi-runde chat til at forfine specifikke elementer uden at starte forfra.

Tekniske specifikationer for Gemini Omni Flash

Udbyder	Google DeepMind
Udgivelsesdato	19. maj 2026 (Google I/O 2026)
Variant	Gemini Omni Flash (første udgivne model i Omni-familien)
Arkitektur	Unified transformer-baseret omni-model (tekst + billede + lyd + video input → video + lyd output)
Inputtilstande	Tekst, billede, lyd, video — herunder multi-reference stacking
Output	Video i høj opløsning med nativt synkroniseret lyd
Maks. varighed	10 sekunder pr. klip (deployment-grænse, ikke modelbestramsning)
Nativ lyd	Dialog (læbesynkronisering), SFX, ambient — genereret i ét enkelt gennemløb
Redigering	Samtalebaseret multi-runde — kamera, baggrunde, objekter, handlinger, stil
Fysik	Forbedret tyngdekraft, kinetisk energi og fluiddynamik
Herkomst	SynthID-vandmærke + C2PA Content Credentials (obligatorisk)
Tilgængelighed	Gemini-app & Google Flow (AI Plus/Pro/Ultra); YouTube Shorts Remix & Create-app (gratis, 18+)
API-adgang	Offentligt Vertex AI API ruller ud i ugerne efter I/O 2026

Hvorfor Gemini Omni Flash skiller sig ud

Unified omni-modelarkitektur

Gemini Omni Flash er Googles første udgivne videomodel bygget på en unified transformer-baseret omni-arkitektur — én model der håndterer tekst, billede, lyd og video i ét enkelt gennemløb, hvilket eliminerer sammenføjningerne mellem modaliteter, som separate pipeline-systemer introducerer. Reference stacking lader dig kombinere et karakterbillede, en lydfil og en stilreference i én enkelt prompt.

Samtalebaseret multi-runde redigering

Beskriv ændringer på almindeligt sprog, og Gemini Omni Flash anvender dem direkte — flyt kameraet, byt et objekt ud, omskriv en scene eller skift en baggrund — mens resten af klippet bevares intakt. Multi-runde redigeringer bygger på tidligere kontekst, så du kan iterere uden at starte forfra.

Nativt synkroniseret lyd + forbedret fysik

Dialog med læbesynkronisering, lydeffekter på skærmen og ambient baggrundslyd produceres sammen med videoen i ét enkelt fremadrettet gennemløb — intet separat TTS- eller Foley-trin. Forbedret forståelse af tyngdekraft, kinetisk energi og fluiddynamik giver mere realistisk bevægelse, og hvert output bærer SynthID- og C2PA-herkomst.

Gemini Omni Flash vs andre AI-videogeneratorer

Feature	Gemini Omni Flash	Veo 3.1	Sora 2	Grok Imagine
Udbyder	Google DeepMind	Google DeepMind	OpenAI	xAI
Arkitektur	Unified transformer omni-model	Diffusion	Diffusion	Aurora (autoregressiv)
Samtalebaseret redigering	Ja — multi-runde	Nej	Nej	Nej
Maks. opløsning	Høj opløsning	1080p	1080p	720p
Maks. varighed	10s (deployment-grænse)	8s (kan forlænges)	20s	15s
Nativ lyd	Ja — ét enkelt gennemløb	Ja	Ja	Ja
Inputtilstande	Tekst, billede, lyd, video	Tekst, billede (op til 3)	Tekst, billede + Cameos	Tekst, 1 billede
Skabeloner	Ja	Nej	Nej	Nej
Herkomst	SynthID + C2PA	SynthID	C2PA	—
Tilgængelighed	Gemini-app, Flow, YouTube	Tilgængelig	Tilgængelig	Tilgængelig

Hvad du kan bygge med Gemini Omni Flash

Samtalebaseret videoredigering

Spring tidslinjeredaktøren helt over — beskriv den ønskede ændring på almindeligt sprog, og Gemini Omni Flash anvender den direkte. Skift kameravinkler, byt objekter ud, skift baggrunde eller omskriv en hel handling med én enkelt prompt.

Skabelonbaseret indhold til sociale medier

Vælg en indbygget skabelon, indsæt din prompt og få et fuldt sammensat 10-sekunders klip med synkroniseret lyd — designet til YouTube Shorts-, Reels- og TikTok-formater uden produktionserfaring kræves.

Oprettelse af dialogscener

Generer realistiske samtalescener med præcis læbesynkronisering og ambient lyd i ét enkelt gennemløb — ideelt til markedsføringsscripts, uddannelsesindhold eller kortfilmdialog.

Reference-stacked generering

Kombiner et karakterbillede, en lydfil og en stilreference i én enkelt prompt for at generere konsistente karakterer, der matcher et specifikt udseende, en stemme og en æstetik på tværs af klip.

Scenestoryboarding

Visualiser hurtigt manusbeats som korte klip med nativ lyd. Brug multi-runde chаt-redigering til at justere indramning, bytte objekter ud eller omskrive handlinger på tværs af optagelser uden at regenerere fra grunden.

Brandvideoproduktion

Brug skabeloner til hurtig branded videooprettelse og forfin derefter med samtalebaseret redigering — byt produktbilleder ud, skift baggrunde eller juster den visuelle tone, så den matcher dit brand.

Udforsk relaterede AI-videogeneratorer

Veo 3.1

Google DeepMinds 1080p-videomodel med billeder-til-video og nativ lydgenerering.

Sora 2

OpenAIs filmiske videogenerator med fysisk præcis bevægelse og 20 sekunders varighed.

Grok Imagine

xAI's Aurora-motor videomodel med Fun/Normal/Spicy-stiltilstande og nativ lyd.

Happy Horse 1.0

AI-videogenerator nr. 1 med filmisk bevægelse og læbesynkronisering på 7 sprog.

Seedance 2.0

ByteDances videomodel med websøgningsintegration og synkroniseret lyd.

Kling 3.0

4K-video af instruktørkvalitet med multi-shot AI-cinematografi og nativt lyd.

Ofte stillede spørgsmål om Gemini Omni Flash

Hvad er Gemini Omni Flash?

Gemini Omni Flash er Google DeepMinds nye unified videogenereringsmodel, annonceret og lanceret på Google I/O 2026 den 19. maj 2026. Det er den første udgivne model i Gemini Omni-familien — bygget på en enkelt transformer-baseret omni-arkitektur, der nativt håndterer tekst-, billede-, lyd- og videoinput og producerer video i høj opløsning med synkroniseret lyd i ét enkelt gennemløb. Fremhævede funktioner inkluderer samtalebaseret multi-runde redigering, forbedret fysikforståelse og reference stacking.

Hvordan adskiller Gemini Omni Flash sig fra Veo 3.1?

Veo 3.1 er en dedikeret videodiffusionsmodel, der udelukkende fokuserer på tekst- og billede-til-video. Gemini Omni Flash er bygget på en unified transformer-baseret omni-arkitektur — én model der håndterer tekst, billede, lyd og video i ét enkelt gennemløb, konceptuelt lignende GPT-4o — og knytter videogenerering til Geminis ræsonnering. Det muliggør samtalebaseret multi-runde redigering, reference stacking og skabelondrevet oprettelse, som Veo 3.1 ikke tilbyder. Veo 3.1 tilbyder i øjeblikket længere klip og rigere multi-billed-inputkontrol.

Hvad er samtalebaseret redigering i Gemini Omni Flash?

Når du har et klip, beskriver du ændringer på almindeligt sprog — "flyt kameravinklen til venstre", "lav skulpturen af bobler", "byt den røde kop ud med en kaffekop" eller "omskriv denne scene, så karakteren er udenfor" — og Gemini Omni Flash bearbejder det målrettede element, mens resten bevares intakt. Multi-runde redigeringer bygger på tidligere kontekst, så du kan iterere uden at starte forfra. Redigering af lyd på eksisterende videoer tilbageholdes bevidst ved lanceringen.

Genererer Gemini Omni Flash synkroniseret lyd?

Ja. Gemini Omni Flash producerer nativt synkroniseret lyd — dialog med læbesynkronisering, lydeffekter timet til handlinger på skærmen og ambient baggrundslyd — i ét enkelt fremadrettet gennemløb sammen med videoen, uden separat TTS- eller Foley-trin. Alle genererede output tagges automatisk med et SynthID-vandmærke og C2PA Content Credentials.

Hvornår er Gemini Omni Flash tilgængelig på LoveGen AI?

Gemini Omni Flash blev lanceret den 19. maj 2026 inde i Gemini-appen, Google Flow, YouTube Shorts Remix og YouTube Create-appen. Offentlig udvikler- og enterprise-API-adgang via Vertex AI ruller ud i ugerne efter Google I/O 2026. LoveGen AI vil integrere Gemini Omni Flash, så snart det API bliver offentligt tilgængeligt.

Hvilke videoskabeloner inkluderer Gemini Omni Flash?

Gemini Omni Flash leveres med skabelonbaseret videooprettelse, anvendt med ét enkelt klik inde i Gemini-appen og Google Flow. Skabeloner håndterer komposition, tempo og lyd til hurtig generering, og et brugerdefineret AI-avatar-oprettelsesflow er også tilgængeligt. Det aktuelle skabelonkatalog befinder sig inde i Gemini-appen og Flow-produktfladerne.