Google DeepMind

Google DeepMind

Gemini Omni

Coming Soon

Endnu ikke officielt udgivet af Google

Google's unified omni-model for video generation is launching soon on LoveGen AI.

Gemini Omni AI-videogenerator

Opret og rediger AI-videoer med Googles unified omni-model

Gemini Omni er Google DeepMinds kommende unified videogenereringsmodel, først set som en UI-streng i Gemini-appen forud for Google I/O 2026. I modsætning til de dedikerede Veo-modeller ser Gemini Omni ud til at være bygget på en unified omni-arkitektur, der håndterer tekst, billede, video og lyd i ét system. Baseret på lækkede demoer understøtter den nativt synkroniseret lyd og chatbaseret videoredigering — præcise specifikationer bekræftes ved officiel meddelelse.

Gemini Omni blev opdaget som en UI-streng i Gemini-appen i maj 2026, blot dage før Google I/O 2026 (planlagt til 19.–20. maj). Google har ikke officielt annonceret modellen, og alle nedenstående oplysninger er baseret på lækkede demoer og UI-strenge snarere end officiel dokumentation. Specifikationer, priser og tilgængelighed bekræftes ved officiel udgivelse.

Fra tilgængelige lækager ser modellen ud til at understøtte chatbaseret videoredigering som en førsteklasses funktion. Brugere ser ud til at kunne beskrive ændringer på naturligt sprog — for eksempel fjerne et vandmærke, bytte et objekt ud med et andet eller omskrive en hel scene — og modellen anvender redigeringen uden manuelt billede-for-billede-arbejde. Lækket demomateriale inkluderede en scene med to mænd, der spiser spaghetti på en luksusrestaurant, og en professor, der skriver matematiske beviser på en tavle mens han fortæller.

Nativt synkroniseret lyd ser ud til at blive produceret i ét enkelt gennemløb: dialog med læbesynkronisering, lydeffekter på skærmen og baggrundsambient — alt sammen uden et separat TTS- eller Foley-efterbehandlingstrin. Et bibliotek med færdiglavet skabeloner til hurtigstart var også synligt i den lækkede app-UI.

Alle tekniske specifikationer — herunder opløsning, varighed, billedfrekvens, billedformater og priser — er ikke officielt bekræftet og vil blive annonceret. LoveGen AI integrerer Gemini Omni, så snart API'et bliver offentligt tilgængeligt.

Sådan bruger du Gemini Omni

01

Trin 1: Vælg din oprettelsestilstand

Vælg tekst til video for generering fra en prompt, billede til video for at animere et referencebillede, eller vælg en færdiglavet skabelon til hurtigstart.

02

Trin 2: Beskriv din video eller redigering

Skriv en detaljeret prompt eller beskriv en redigering på hverdagssprog — Gemini Omni forstår naturlige sproglige sceneændringer, objektudskiftninger og stiljusteringer via chat.

03

Trin 3: Generer og forfin

Klik på Generer. Gemini Omni returnerer en video med nativt synkroniseret lyd. Brug chatredaktøren til at forfine specifikke elementer uden at starte forfra.

Tekniske specifikationer for Gemini Omni

UdbyderGoogle DeepMind
ArkitekturUnified omni-model (tekst + billede + video + lyd) — bekræftes ved officiel meddelelse
Nuværende statusIkke officielt annonceret — set i lækket UI, maj 2026
Forventet meddelelseGoogle I/O 2026 (19.–20. maj 2026)
InputtilstandeTekst til video, Billede til video, Chatbaseret redigering (baseret på lækkede demoer — TBD)
VideoredigeringVia chat: objektudskiftning, fjernelse af vandmærker, omskrivning af scener (baseret på lækkede demoer — TBD)
SkabelonerBibliotek med færdiglavet skabeloner (baseret på lækket UI — TBD)
Nativ lydDialog (læbesynkronisering), SFX, ambient baggrundslyd i ét gennemløb (baseret på lækkede demoer — TBD)
OpløsningTBD — bekræftes ved officiel udgivelse
Varighed / FPS / PriserTBD — bekræftes ved officiel udgivelse

Hvorfor Gemini Omni skiller sig ud

Unified omni-modelarkitektur

Gemini Omni ser ud til at være den første Google-videomodel bygget på en unified omni-arkitektur — én model håndterer tekst, billede, video og lyd i ét enkelt gennemløb, hvilket eliminerer sammenføjningerne mellem modaliteter, som separate pipeline-modeller introducerer. Arkitekturdetaljer bekræftes officielt.

Chatbaseret videoredigering

Baseret på lækkede demoer kan du beskrive ændringer på hverdagssprog, og Gemini Omni anvender dem direkte — fjern et vandmærke, udskift et objekt, omskriv en scene. Ingen tidslinjescrubbning eller billede-for-billede-redigering kræves. Funktionsdetaljer bekræftes ved officiel udgivelse.

Nativt synkroniseret lyd i ét enkelt gennemløb

Lækkede demoer viser dialog med læbesynkronisering, lydeffekter på skærmen og ambient baggrundslyd produceret sammen med videoen i ét enkelt fremadrettet gennemløb — intet separat TTS- eller Foley-trin. Bekræftede specifikationer annonceres officielt.

Gemini Omni vs andre AI-videogeneratorer

FeatureGemini OmniVeo 3.1Sora 2Grok Imagine
UdbyderGoogle DeepMindGoogle DeepMindOpenAIxAI
ArkitekturUnified omni-model (TBD)DiffusionDiffusionAurora (autogressiv)
Chatbaseret redigeringJa (ifølge lækkede demoer)NejNejNej
Maks. opløsningTBD1080p1080p720p
Nativ lydJa (ifølge lækkede demoer)JaJaJa
Billede-inputTBDOp til 3 billeder1 billede + Cameos1 billede
SkabelonerJa (ifølge lækket UI)NejNejNej
TilgængelighedKommer snartTilgængeligTilgængeligTilgængelig

Forventede anvendelsesområder for skabere, redaktører og historiefortællere

01

Chatbaseret videoredigering

Baseret på lækkede demoer kan du springe tidslinjeredaktøren over og beskrive den ønskede ændring — fjern et element, udskift et objekt, skift indstilling — og Gemini Omni anvender det direkte via naturligt sprog.

02

Skabelonbaseret indhold til sociale medier

Baseret på det lækkede UI kan du vælge en færdiglavet skabelon, indsætte din prompt og få en fuldt sammensat video med lyd — ingen produktionserfaring kræves. Fulde skabelondetaljer bekræftes ved officiel udgivelse.

03

Oprettelse af dialogscener

Generer realistiske samtalesscener med nøjagtig læbesynkronisering og ambient lyd i ét enkelt gennemløb — ideelt til markedsføringsscripts, uddannelsesindhold eller kortfilmdialog.

04

Billedanimation med lyd

Upload et foto eller en illustration og animer det med en prompt. Gemini Omni tilføjer bevægelse og synkroniserede lydeffekter uden et separat lydværktøj.

05

Scenestoryboarding

Visualiser hurtigt manusbeats som korte klip med nativ lyd. Brug chatredaktøren til at justere indramning eller dialog mellem optagelser uden at regenerere fra grunden.

06

Brandvideoproduktion

Brug skabeloner til hurtig brandvideoproduktion og forfin derefter med chatbaseret redigering — udskift elementer eller juster tonen, så den matcher din brands stemme.

Udforsk relaterede AI-videogeneratorer

Ofte stillede spørgsmål om Gemini Omni

Hvad er Gemini Omni?

Gemini Omni er Google DeepMinds kommende videogenereringsmodel, først set som en UI-streng i Gemini-appen forud for Google I/O 2026. Det ser ud til at være en unified omni-model, der håndterer tekst, billede, video og lyd i ét system, med nativt synkroniseret lyd og chatbaseret videoredigering. Alle detaljer bekræftes ved den officielle meddelelse.

Hvordan adskiller Gemini Omni sig fra Veo 3.1?

Veo 3.1 er en dedikeret videodiffusionsmodel med kendte, dokumenterede specifikationer. Gemini Omni ser ud til at være bygget på en unified omni-arkitektur — én model håndterer tekst, billede, video og lyd i ét enkelt gennemløb, svarende til GPT-4o. Dette muliggør chatbaseret redigering og skabelonbaseret oprettelse, som Veo 3.1 ikke tilbyder. Præcise arkitekturdetaljer bekræftes officielt.

Hvad er chatbaseret videoredigering i Gemini Omni?

Baseret på lækkede demoer lader Gemini Omni dig beskrive redigeringer på hverdagssprog — for eksempel: 'fjern vandmærket', 'udskift den røde kop med en kaffekop', eller 'omskriv denne scene, så karakteren er udenfor'. Modellen anvender redigeringen uden manuelt billede-for-billede-arbejde. Denne funktion er ikke officielt bekræftet, og detaljer kan ændre sig.

Genererer Gemini Omni synkroniseret lyd?

Baseret på lækkede demoer ser Gemini Omni ud til at producere nativt synkroniseret lyd — herunder dialog med læbesynkronisering, lydeffekter synkroniseret med handlinger på skærmen og ambient baggrundslyd — i ét enkelt fremadrettet gennemløb. Dette er ikke officielt bekræftet, og fuld specifikation annonceres på Google I/O 2026.

Hvornår er Gemini Omni tilgængelig på LoveGen AI?

Gemini Omni blev set i et lækket UI forud for Google I/O 2026 (19.–20. maj 2026). Google har endnu ikke officielt annonceret priser, et API eller en tilgængelighedsdato. LoveGen AI integrerer det, så snart API'et bliver offentligt tilgængeligt.

Hvilke videoskabeloner inkluderer Gemini Omni?

Et bibliotek med færdiglavet skabeloner var synligt i den lækkede Gemini-app-UI. Skabeloner ser ud til automatisk at håndtere komposition, tempo og lyd til hurtig videooprettelse. Fulde detaljer — herunder antal skabeloner og kategorier — bekræftes ved den officielle meddelelse.