
Grok Imagine AI-Videogenerator
Lav stiliserede AI-videoer med xAI's Aurora-motor i Grok Imagine
Grok Imagine er xAI's videogenererings-model, drevet af den autoregressive Aurora-motor og trænet på Colossus-supercomputeren med 110.000 NVIDIA GB200 GPU'er. Den genererer 6 eller 10 sekunders klip i 480p eller 720p med native lyd, understøtter tekst-til-video og billede-til-video og leverer tre tydelige stiltilstande — Fun, Normal og Spicy — så du kan skifte den kreative tone i en prompt med ét klik.
Grok Imagine 1.0 nåede generel tilgængelighed den 2. februar 2026 efter en preview-lancering i 2025. Modellen bygger på Aurora, xAI's autoregressive arkitektur til frame-forudsigelse, der renderer sekventielt fra venstre til højre i stedet for via diffusion. Træningen brugte Colossus-supercomputeren med 110.000 NVIDIA GB200 GPU'er — en af de største træningsinfrastrukturer inden for AI-video til dato — og den offentlige platform har allerede produceret over 1,245 milliarder videoer i et enkelt 30-dages vindue.
Modellen tilbyder to inputtilstande inden for LoveGen AI. Tekst-til-video accepterer en prompt på op til 2.000 tegn og renderer bevægelse i fem billedformater — 16:9, 9:16, 1:1, 3:2 og 2:3 — der dækker liggende, stående, kvadratiske og klassiske fotografiske formater. Billede-til-video accepterer ét referencebillede (JPG, JPEG, PNG eller WebP, op til 20 MB) og animerer det efter din prompt. Begge tilstande renderer ved 24 fps i 6 eller 10 sekunders længde med output op til 720p.
Den definerende funktion er stiltilstand-skifteren. Normal-tilstand holder resultatet afbalanceret og tro mod prompten. Fun trækker mod legesyge, overdrevne og kreative fortolkninger. Spicy låser op for dristigere og mere dramatiske renderinger. Lyd er native i Aurora — dialog med læbesynkronisering, baggrundsmusik og omgivende effekter genereres sammen i et enkelt forward-pass uden separat efterbehandling. Den 2. marts 2026 udgav xAI Extend from Frame, der kæder klip sammen ved at bruge det sidste billede fra ét som startbillede for det næste; modellen returnerer et 6 eller 10 sekunders klip på cirka 30 sekunder i gennemsnit. Generering kører asynkront i LoveGen AI — indsend opgaven, og den færdige video lander i dit galleri til preview, download og direkte sammenligning med Sora 2, Veo 3.1, Seedance 2.0 og Happy Horse 1.0 i samme arbejdsområde.
Sådan bruger du Grok Imagine
Trin 1: Vælg Tekst-til-video eller Billede-til-video
Skift mellem tekst-til-video til prompt-baseret generering eller billede-til-video for at animere et uploadet referencebillede.
Trin 2: Vælg dine indstillinger
Vælg længde (6s eller 10s), opløsning (480p eller 720p), billedformat (kun T2V) og stiltilstand (Fun eller Normal).
Trin 3: Generér og download
Klik på Generér. Aurora returnerer et færdigt klip med native lyd på cirka 30 sekunder — preview, download eller sammenlign side om side med andre modeller i dit galleri.
Grok Imagine tekniske specifikationer
| Udbyder | xAI |
| Motor | Aurora — autoregressiv frame-forudsigelse |
| Seneste version | Grok Imagine 1.0 (generel tilgængelighed 2. februar 2026) |
| Træningsinfrastruktur | Colossus-supercomputer, 110.000 NVIDIA GB200 GPU'er |
| Inputtilstande | Tekst-til-video, Billede-til-video |
| Stiltilstande | Fun, Normal, Spicy |
| Videolængde | 6 eller 10 sekunder (xAI tilbyder også 15s via Extend from Frame) |
| Opløsninger | 480p, 720p |
| Billedhastighed | 24 fps |
| Billedformater (T2V) | 16:9, 9:16, 1:1, 3:2, 2:3 |
| Billedinput (I2V) | 1 billede — JPG / JPEG / PNG / WebP, op til 20 MB |
| Lyd | Native — dialog (med læbesynkronisering), baggrundsmusik, lydeffekter |
| Genereringshastighed | ~30 sekunder i gennemsnit pr. klip |
| Resultatets gyldighed | Genererede videolinks forbliver gyldige i 24 timer efter færdiggørelse |
Hvorfor vælge Grok Imagine
Aurora autoregressiv motor
Grok Imagine bygger på Aurora, xAI's frame-for-frame autoregressive videomodel trænet på 110.000 NVIDIA GB200 GPU'er — en fundamentalt anderledes tilgang end diffusion-baserede konkurrenter og en nøglegrund til, at bevægelsen føles særegen.
Tre stiltilstande som standard
Fun, Normal og Spicy lader dig ændre kreativ tone uden at omskrive prompten. De fleste videomodeller giver ét look; Grok Imagine giver tre fra det samme input.
Native lyd i ét pass
Dialog med læbesynkronisering, omgivelseslyd og baggrundsmusik produceres sammen med videoen — ingen separat lydfase, ingen synkroniseringsfejl.
Grok Imagine vs andre AI-videogeneratorer
| Feature | Grok Imagine | Sora 2 | Veo 3.1 | Seedance 2.0 |
|---|---|---|---|---|
| Udbyder | xAI | OpenAI | Google DeepMind | ByteDance |
| Arkitektur | Aurora (autoregressiv) | Diffusion | Diffusion | Diffusion |
| Maks. opløsning | 720p | 1080p | 1080p | 1080p |
| Længdemuligheder | 6s, 10s (15s via Extend) | 4s, 8s, 12s | 4s, 6s, 8s | 4-15s |
| Stiltilstande | Fun, Normal, Spicy | Enkelt tilstand | Enkelt tilstand | Enkelt tilstand |
| Billedinput | 1 billede (I2V) | 1 billede + Cameos | Op til 3 billeder | 1–2 billeder |
| Billedformater (T2V) | 16:9, 9:16, 1:1, 3:2, 2:3 | 16:9, 9:16, 1:1, 3:2, 2:3 | 16:9, 9:16 | 16:9, 9:16, 1:1, +4 flere |
| Native lyd | Ja | Ja | Ja | Ja |
| Gns. genereringshastighed | ~30s | ~60s | ~45s | ~40s |
Perfekt til skabere, marketingfolk og fortællere
Sociale medie-klip
Generer korte 6 eller 10 sekunders videoer i 9:16 eller 1:1 til TikTok, Reels og Shorts. Vælg Fun-tilstand for energisk, scroll-stoppende indhold med native lyd inkluderet.
Billedanimationer
Upload et eksisterende foto eller en illustration og forvandl det til en bevægelig sekvens — perfekt til produktfotos, character art eller behind-the-scenes-billeder.
Konceptboards
Generer hurtigt flere stilistiske versioner af samme scene i 480p, lås den retning, du foretrækker, og render igen i 720p — ideelt til ideation og pitch.
Annoncer og promo'er
Brug 16:9 vandret til hero-placeringer og 9:16 lodret til vertikale kanaler. Stiltilstand-skifteren lader dig matche brand-tonen — legesyg eller afbalanceret — uden at omskrive prompten.
Storyboarding
Visualiser hurtigt manuskript-beats som 6 sekunders klip med synkroniseret dialog. Iterer på kadrering og bevægelse, før du satser på en længere model.
Undervisningsindhold
Animer diagrammer, fotos og koncept-illustrationer til korte, engagerende klip med native voiceover, der holder opmærksomheden bedre end statiske slides.
Udforsk relaterede AI-videogeneratorer

Sora 2
OpenAI's filmiske videogenerator med fysisk præcis bevægelse og 20s varighed.

Veo 3.1
Google DeepMinds 1080p-videomodel med frames-til-video og lydgenerering.

Seedance 2.0
ByteDances videomodel med integreret websøgning og synkroniseret lyd.
Happy Horse 1.0
Alibabas #1-videomodel med filmisk bevægelseskvalitet og læbesynkronisering på 7 sprog.
Kling 2.5 Turbo
Kuaishous hurtige 1080p-videogenerator, optimeret til hastighed og omkostningseffektivitet.

Veo 4
Googles næste generations videomodel med 4K-opskalering og spatial lyd.
Ofte stillede spørgsmål om Grok Imagine
Hvad er Grok Imagine?
Grok Imagine er xAI's videogenererings-model, bygget på den autoregressive Aurora-motor og trænet på Colossus-supercomputeren med 110.000 NVIDIA GB200 GPU'er. Den understøtter tekst-til-video og billede-til-video med tre kreative stiltilstande — Fun, Normal og Spicy — der ændrer tonen i enhver prompt.
Hvornår blev Grok Imagine udgivet?
Grok Imagine startede som preview i 2025 og nåede version 1.0 med generel tilgængelighed den 2. februar 2026. xAI fortsætter med at udgive opdateringer — senest Extend from Frame den 2. marts 2026, der kæder klip sammen til sekvenser på op til 15 sekunder pr. kædet klip.
Hvilke længder og opløsninger understøttes?
Grok Imagine genererer 6 eller 10 sekunders klip i 480p eller 720p, renderet ved 24 fps. Gennemsnitlig genereringstid er omkring 30 sekunder pr. klip.
Hvilke billedformater er tilgængelige?
Tekst-til-video understøtter 16:9, 9:16, 1:1, 3:2 og 2:3 — liggende, stående, kvadratiske og klassiske fotoformater. Billede-til-video bevarer billedformatet på dit uploadede referencebillede.
Hvad er forskellen på Fun, Normal og Spicy?
Normal giver afbalancerede, trofaste resultater. Fun går mod legesyge, overdrevne og kreative fortolkninger. Spicy låser op for dristigere, mere dramatiske resultater. Den samme prompt i forskellige tilstande kan give markant forskellige filmiske stemninger.
Genererer Grok Imagine lyd?
Ja. Aurora producerer native synkroniseret dialog med læbesynkronisering, baggrundsmusik og omgivende effekter i et enkelt forward-pass — ingen separat efterbehandling er nødvendig.