Loading

Grok Imagine AI-Videogenerator

Lav stiliserede AI-videoer med xAI's Aurora-motor i Grok Imagine

Grok Imagine er xAI's videogenererings-model, drevet af den autoregressive Aurora-motor og trænet på Colossus-supercomputeren med 110.000 NVIDIA GB200 GPU'er. Den genererer 6 eller 10 sekunders klip i 480p eller 720p med native lyd, understøtter tekst-til-video og billede-til-video og leverer tre tydelige stiltilstande — Fun, Normal og Spicy — så du kan skifte den kreative tone i en prompt med ét klik.

Grok Imagine 1.0 nåede generel tilgængelighed den 2. februar 2026 efter en preview-lancering i 2025. Modellen bygger på Aurora, xAI's autoregressive arkitektur til frame-forudsigelse, der renderer sekventielt fra venstre til højre i stedet for via diffusion. Træningen brugte Colossus-supercomputeren med 110.000 NVIDIA GB200 GPU'er — en af de største træningsinfrastrukturer inden for AI-video til dato — og den offentlige platform har allerede produceret over 1,245 milliarder videoer i et enkelt 30-dages vindue.

Modellen tilbyder to inputtilstande inden for LoveGen AI. Tekst-til-video accepterer en prompt på op til 2.000 tegn og renderer bevægelse i fem billedformater — 16:9, 9:16, 1:1, 3:2 og 2:3 — der dækker liggende, stående, kvadratiske og klassiske fotografiske formater. Billede-til-video accepterer ét referencebillede (JPG, JPEG, PNG eller WebP, op til 20 MB) og animerer det efter din prompt. Begge tilstande renderer ved 24 fps i 6 eller 10 sekunders længde med output op til 720p.

Den definerende funktion er stiltilstand-skifteren. Normal-tilstand holder resultatet afbalanceret og tro mod prompten. Fun trækker mod legesyge, overdrevne og kreative fortolkninger. Spicy låser op for dristigere og mere dramatiske renderinger. Lyd er native i Aurora — dialog med læbesynkronisering, baggrundsmusik og omgivende effekter genereres sammen i et enkelt forward-pass uden separat efterbehandling. Den 2. marts 2026 udgav xAI Extend from Frame, der kæder klip sammen ved at bruge det sidste billede fra ét som startbillede for det næste; modellen returnerer et 6 eller 10 sekunders klip på cirka 30 sekunder i gennemsnit. Generering kører asynkront i LoveGen AI — indsend opgaven, og den færdige video lander i dit galleri til preview, download og direkte sammenligning med Sora 2, Veo 3.1, Seedance 2.0 og Happy Horse 1.0 i samme arbejdsområde.

Sådan bruger du Grok Imagine

01

Trin 1: Vælg Tekst-til-video eller Billede-til-video

Skift mellem tekst-til-video til prompt-baseret generering eller billede-til-video for at animere et uploadet referencebillede.

02

Trin 2: Vælg dine indstillinger

Vælg længde (6s eller 10s), opløsning (480p eller 720p), billedformat (kun T2V) og stiltilstand (Fun eller Normal).

03

Trin 3: Generér og download

Klik på Generér. Aurora returnerer et færdigt klip med native lyd på cirka 30 sekunder — preview, download eller sammenlign side om side med andre modeller i dit galleri.

Grok Imagine tekniske specifikationer

UdbyderxAI
MotorAurora — autoregressiv frame-forudsigelse
Seneste versionGrok Imagine 1.0 (generel tilgængelighed 2. februar 2026)
TræningsinfrastrukturColossus-supercomputer, 110.000 NVIDIA GB200 GPU'er
InputtilstandeTekst-til-video, Billede-til-video
StiltilstandeFun, Normal, Spicy
Videolængde6 eller 10 sekunder (xAI tilbyder også 15s via Extend from Frame)
Opløsninger480p, 720p
Billedhastighed24 fps
Billedformater (T2V)16:9, 9:16, 1:1, 3:2, 2:3
Billedinput (I2V)1 billede — JPG / JPEG / PNG / WebP, op til 20 MB
LydNative — dialog (med læbesynkronisering), baggrundsmusik, lydeffekter
Genereringshastighed~30 sekunder i gennemsnit pr. klip
Resultatets gyldighedGenererede videolinks forbliver gyldige i 24 timer efter færdiggørelse

Hvorfor vælge Grok Imagine

Aurora autoregressiv motor

Grok Imagine bygger på Aurora, xAI's frame-for-frame autoregressive videomodel trænet på 110.000 NVIDIA GB200 GPU'er — en fundamentalt anderledes tilgang end diffusion-baserede konkurrenter og en nøglegrund til, at bevægelsen føles særegen.

Tre stiltilstande som standard

Fun, Normal og Spicy lader dig ændre kreativ tone uden at omskrive prompten. De fleste videomodeller giver ét look; Grok Imagine giver tre fra det samme input.

Native lyd i ét pass

Dialog med læbesynkronisering, omgivelseslyd og baggrundsmusik produceres sammen med videoen — ingen separat lydfase, ingen synkroniseringsfejl.

Grok Imagine vs andre AI-videogeneratorer

FeatureGrok ImagineSora 2Veo 3.1Seedance 2.0
UdbyderxAIOpenAIGoogle DeepMindByteDance
ArkitekturAurora (autoregressiv)DiffusionDiffusionDiffusion
Maks. opløsning720p1080p1080p1080p
Længdemuligheder6s, 10s (15s via Extend)4s, 8s, 12s4s, 6s, 8s4-15s
StiltilstandeFun, Normal, SpicyEnkelt tilstandEnkelt tilstandEnkelt tilstand
Billedinput1 billede (I2V)1 billede + CameosOp til 3 billeder1–2 billeder
Billedformater (T2V)16:9, 9:16, 1:1, 3:2, 2:316:9, 9:16, 1:1, 3:2, 2:316:9, 9:1616:9, 9:16, 1:1, +4 flere
Native lydJaJaJaJa
Gns. genereringshastighed~30s~60s~45s~40s

Perfekt til skabere, marketingfolk og fortællere

01

Sociale medie-klip

Generer korte 6 eller 10 sekunders videoer i 9:16 eller 1:1 til TikTok, Reels og Shorts. Vælg Fun-tilstand for energisk, scroll-stoppende indhold med native lyd inkluderet.

02

Billedanimationer

Upload et eksisterende foto eller en illustration og forvandl det til en bevægelig sekvens — perfekt til produktfotos, character art eller behind-the-scenes-billeder.

03

Konceptboards

Generer hurtigt flere stilistiske versioner af samme scene i 480p, lås den retning, du foretrækker, og render igen i 720p — ideelt til ideation og pitch.

04

Annoncer og promo'er

Brug 16:9 vandret til hero-placeringer og 9:16 lodret til vertikale kanaler. Stiltilstand-skifteren lader dig matche brand-tonen — legesyg eller afbalanceret — uden at omskrive prompten.

05

Storyboarding

Visualiser hurtigt manuskript-beats som 6 sekunders klip med synkroniseret dialog. Iterer på kadrering og bevægelse, før du satser på en længere model.

06

Undervisningsindhold

Animer diagrammer, fotos og koncept-illustrationer til korte, engagerende klip med native voiceover, der holder opmærksomheden bedre end statiske slides.

Udforsk relaterede AI-videogeneratorer

Ofte stillede spørgsmål om Grok Imagine

Hvad er Grok Imagine?

Grok Imagine er xAI's videogenererings-model, bygget på den autoregressive Aurora-motor og trænet på Colossus-supercomputeren med 110.000 NVIDIA GB200 GPU'er. Den understøtter tekst-til-video og billede-til-video med tre kreative stiltilstande — Fun, Normal og Spicy — der ændrer tonen i enhver prompt.

Hvornår blev Grok Imagine udgivet?

Grok Imagine startede som preview i 2025 og nåede version 1.0 med generel tilgængelighed den 2. februar 2026. xAI fortsætter med at udgive opdateringer — senest Extend from Frame den 2. marts 2026, der kæder klip sammen til sekvenser på op til 15 sekunder pr. kædet klip.

Hvilke længder og opløsninger understøttes?

Grok Imagine genererer 6 eller 10 sekunders klip i 480p eller 720p, renderet ved 24 fps. Gennemsnitlig genereringstid er omkring 30 sekunder pr. klip.

Hvilke billedformater er tilgængelige?

Tekst-til-video understøtter 16:9, 9:16, 1:1, 3:2 og 2:3 — liggende, stående, kvadratiske og klassiske fotoformater. Billede-til-video bevarer billedformatet på dit uploadede referencebillede.

Hvad er forskellen på Fun, Normal og Spicy?

Normal giver afbalancerede, trofaste resultater. Fun går mod legesyge, overdrevne og kreative fortolkninger. Spicy låser op for dristigere, mere dramatiske resultater. Den samme prompt i forskellige tilstande kan give markant forskellige filmiske stemninger.

Genererer Grok Imagine lyd?

Ja. Aurora producerer native synkroniseret dialog med læbesynkronisering, baggrundsmusik og omgivende effekter i et enkelt forward-pass — ingen separat efterbehandling er nødvendig.