Published Apr 29, 2026Updated Apr 29, 2026

Grok Imagine AI-Videogenerator

Lav stiliserede AI-videoer med xAI's Aurora-motor i Grok Imagine

Grok Imagine er xAI's videogenererings-model, drevet af den autoregressive Aurora-motor og trænet på Colossus-supercomputeren med 110.000 NVIDIA GB200 GPU'er. Den genererer 6 eller 10 sekunders klip i 480p eller 720p med native lyd, understøtter tekst-til-video og billede-til-video og leverer tre tydelige stiltilstande — Fun, Normal og Spicy — så du kan skifte den kreative tone i en prompt med ét klik.

Grok Imagine 1.0 nåede generel tilgængelighed den 2. februar 2026 efter en preview-lancering i 2025. Modellen bygger på Aurora, xAI's autoregressive arkitektur til frame-forudsigelse, der renderer sekventielt fra venstre til højre i stedet for via diffusion. Træningen brugte Colossus-supercomputeren med 110.000 NVIDIA GB200 GPU'er — en af de største træningsinfrastrukturer inden for AI-video til dato — og den offentlige platform har allerede produceret over 1,245 milliarder videoer i et enkelt 30-dages vindue.

Modellen tilbyder to inputtilstande inden for LoveGen AI. Tekst-til-video accepterer en prompt på op til 2.000 tegn og renderer bevægelse i fem billedformater — 16:9, 9:16, 1:1, 3:2 og 2:3 — der dækker liggende, stående, kvadratiske og klassiske fotografiske formater. Billede-til-video accepterer ét referencebillede (JPG, JPEG, PNG eller WebP, op til 20 MB) og animerer det efter din prompt. Begge tilstande renderer ved 24 fps i 6 eller 10 sekunders længde med output op til 720p.

Den definerende funktion er stiltilstand-skifteren. Normal-tilstand holder resultatet afbalanceret og tro mod prompten. Fun trækker mod legesyge, overdrevne og kreative fortolkninger. Spicy låser op for dristigere og mere dramatiske renderinger. Lyd er native i Aurora — dialog med læbesynkronisering, baggrundsmusik og omgivende effekter genereres sammen i et enkelt forward-pass uden separat efterbehandling. Den 2. marts 2026 udgav xAI Extend from Frame, der kæder klip sammen ved at bruge det sidste billede fra ét som startbillede for det næste; modellen returnerer et 6 eller 10 sekunders klip på cirka 30 sekunder i gennemsnit. Generering kører asynkront i LoveGen AI — indsend opgaven, og den færdige video lander i dit galleri til preview, download og direkte sammenligning med Sora 2, Veo 3.1, Seedance 2.0 og Happy Horse 1.0 i samme arbejdsområde.

Sådan bruger du Grok Imagine

Trin 1: Vælg Tekst-til-video eller Billede-til-video

Skift mellem tekst-til-video til prompt-baseret generering eller billede-til-video for at animere et uploadet referencebillede.

Trin 2: Vælg dine indstillinger

Vælg længde (6s eller 10s), opløsning (480p eller 720p), billedformat (kun T2V) og stiltilstand (Fun eller Normal).

Trin 3: Generér og download

Klik på Generér. Aurora returnerer et færdigt klip med native lyd på cirka 30 sekunder — preview, download eller sammenlign side om side med andre modeller i dit galleri.

Grok Imagine tekniske specifikationer

Udbyder	xAI
Motor	Aurora — autoregressiv frame-forudsigelse
Seneste version	Grok Imagine 1.0 (generel tilgængelighed 2. februar 2026)
Træningsinfrastruktur	Colossus-supercomputer, 110.000 NVIDIA GB200 GPU'er
Inputtilstande	Tekst-til-video, Billede-til-video
Stiltilstande	Fun, Normal, Spicy
Videolængde	6 eller 10 sekunder (xAI tilbyder også 15s via Extend from Frame)
Opløsninger	480p, 720p
Billedhastighed	24 fps
Billedformater (T2V)	16:9, 9:16, 1:1, 3:2, 2:3
Billedinput (I2V)	1 billede — JPG / JPEG / PNG / WebP, op til 20 MB
Lyd	Native — dialog (med læbesynkronisering), baggrundsmusik, lydeffekter
Genereringshastighed	~30 sekunder i gennemsnit pr. klip
Resultatets gyldighed	Genererede videolinks forbliver gyldige i 24 timer efter færdiggørelse

Hvorfor vælge Grok Imagine

Aurora autoregressiv motor

Grok Imagine bygger på Aurora, xAI's frame-for-frame autoregressive videomodel trænet på 110.000 NVIDIA GB200 GPU'er — en fundamentalt anderledes tilgang end diffusion-baserede konkurrenter og en nøglegrund til, at bevægelsen føles særegen.

Tre stiltilstande som standard

Fun, Normal og Spicy lader dig ændre kreativ tone uden at omskrive prompten. De fleste videomodeller giver ét look; Grok Imagine giver tre fra det samme input.

Native lyd i ét pass

Dialog med læbesynkronisering, omgivelseslyd og baggrundsmusik produceres sammen med videoen — ingen separat lydfase, ingen synkroniseringsfejl.

Grok Imagine vs andre AI-videogeneratorer

Feature	Grok Imagine	Sora 2	Veo 3.1	Seedance 2.0
Udbyder	xAI	OpenAI	Google DeepMind	ByteDance
Arkitektur	Aurora (autoregressiv)	Diffusion	Diffusion	Diffusion
Maks. opløsning	720p	1080p	1080p	1080p
Længdemuligheder	6s, 10s (15s via Extend)	4s, 8s, 12s	4s, 6s, 8s	4-15s
Stiltilstande	Fun, Normal, Spicy	Enkelt tilstand	Enkelt tilstand	Enkelt tilstand
Billedinput	1 billede (I2V)	1 billede + Cameos	Op til 3 billeder	1–2 billeder
Billedformater (T2V)	16:9, 9:16, 1:1, 3:2, 2:3	16:9, 9:16, 1:1, 3:2, 2:3	16:9, 9:16	16:9, 9:16, 1:1, +4 flere
Native lyd	Ja	Ja	Ja	Ja
Gns. genereringshastighed	~30s	~60s	~45s	~40s

Perfekt til skabere, marketingfolk og fortællere

Sociale medie-klip

Generer korte 6 eller 10 sekunders videoer i 9:16 eller 1:1 til TikTok, Reels og Shorts. Vælg Fun-tilstand for energisk, scroll-stoppende indhold med native lyd inkluderet.

Billedanimationer

Upload et eksisterende foto eller en illustration og forvandl det til en bevægelig sekvens — perfekt til produktfotos, character art eller behind-the-scenes-billeder.

Konceptboards

Generer hurtigt flere stilistiske versioner af samme scene i 480p, lås den retning, du foretrækker, og render igen i 720p — ideelt til ideation og pitch.

Annoncer og promo'er

Brug 16:9 vandret til hero-placeringer og 9:16 lodret til vertikale kanaler. Stiltilstand-skifteren lader dig matche brand-tonen — legesyg eller afbalanceret — uden at omskrive prompten.

Storyboarding

Visualiser hurtigt manuskript-beats som 6 sekunders klip med synkroniseret dialog. Iterer på kadrering og bevægelse, før du satser på en længere model.

Undervisningsindhold

Animer diagrammer, fotos og koncept-illustrationer til korte, engagerende klip med native voiceover, der holder opmærksomheden bedre end statiske slides.

Udforsk relaterede AI-videogeneratorer

Sora 2

OpenAI's filmiske videogenerator med fysisk præcis bevægelse og 20s varighed.

Veo 3.1

Google DeepMinds 1080p-videomodel med frames-til-video og lydgenerering.

Seedance 2.0

ByteDances videomodel med integreret websøgning og synkroniseret lyd.

Happy Horse 1.0

Alibabas #1-videomodel med filmisk bevægelseskvalitet og læbesynkronisering på 7 sprog.

Kling 2.5 Turbo

Kuaishous hurtige 1080p-videogenerator, optimeret til hastighed og omkostningseffektivitet.

Veo 4

Googles næste generations videomodel med 4K-opskalering og spatial lyd.

Ofte stillede spørgsmål om Grok Imagine

Hvad er Grok Imagine?

Grok Imagine er xAI's videogenererings-model, bygget på den autoregressive Aurora-motor og trænet på Colossus-supercomputeren med 110.000 NVIDIA GB200 GPU'er. Den understøtter tekst-til-video og billede-til-video med tre kreative stiltilstande — Fun, Normal og Spicy — der ændrer tonen i enhver prompt.

Hvornår blev Grok Imagine udgivet?

Grok Imagine startede som preview i 2025 og nåede version 1.0 med generel tilgængelighed den 2. februar 2026. xAI fortsætter med at udgive opdateringer — senest Extend from Frame den 2. marts 2026, der kæder klip sammen til sekvenser på op til 15 sekunder pr. kædet klip.

Hvilke længder og opløsninger understøttes?

Grok Imagine genererer 6 eller 10 sekunders klip i 480p eller 720p, renderet ved 24 fps. Gennemsnitlig genereringstid er omkring 30 sekunder pr. klip.

Hvilke billedformater er tilgængelige?

Tekst-til-video understøtter 16:9, 9:16, 1:1, 3:2 og 2:3 — liggende, stående, kvadratiske og klassiske fotoformater. Billede-til-video bevarer billedformatet på dit uploadede referencebillede.

Hvad er forskellen på Fun, Normal og Spicy?

Normal giver afbalancerede, trofaste resultater. Fun går mod legesyge, overdrevne og kreative fortolkninger. Spicy låser op for dristigere, mere dramatiske resultater. Den samme prompt i forskellige tilstande kan give markant forskellige filmiske stemninger.

Genererer Grok Imagine lyd?

Ja. Aurora producerer native synkroniseret dialog med læbesynkronisering, baggrundsmusik og omgivende effekter i et enkelt forward-pass — ingen separat efterbehandling er nødvendig.