
Grok Imagine AI-Videogenerator
Maak gestileerde AI-video's met de Aurora-engine van xAI in Grok Imagine
Grok Imagine is het videogeneratiemodel van xAI, aangedreven door de autoregressieve Aurora-engine en getraind op de Colossus-supercomputer met 110.000 NVIDIA GB200 GPU's. Het genereert clips van 6 of 10 seconden in 480p of 720p met native audio, ondersteunt tekst-naar-video en beeld-naar-video, en levert drie afzonderlijke stijlmodi — Fun, Normal en Spicy — waarmee je de creatieve toon van een prompt met één klik wisselt.
Grok Imagine 1.0 bereikte op 2 februari 2026 de algemene beschikbaarheid, na een previewlancering in 2025. Het model is gebaseerd op Aurora, xAI's autoregressieve framevoorspellingsarchitectuur, die sequentieel van links naar rechts rendert in plaats van via diffusie. De training gebruikte de Colossus-supercomputer met 110.000 NVIDIA GB200 GPU's — een van de grootste trainingsinfrastructuren in AI-video tot nu toe — en het publieke platform heeft al meer dan 1,245 miljard video's geproduceerd in een enkel venster van 30 dagen.
Het model biedt twee invoermodi binnen LoveGen AI. Tekst-naar-video accepteert een prompt tot 2.000 tekens en rendert beweging in vijf beeldverhoudingen — 16:9, 9:16, 1:1, 3:2 en 2:3 — en dekt liggende, staande, vierkante en klassieke fotografische uitsnedes. Beeld-naar-video accepteert één referentiebeeld (JPG, JPEG, PNG of WebP, tot 20 MB) en animeert dat volgens je prompt. Beide modi renderen op 24 fps in 6 of 10 seconden, met uitvoer tot 720p.
Het onderscheidende kenmerk is de schakelaar voor stijlmodi. Normal houdt het resultaat gebalanceerd en trouw aan je prompt. Fun gaat richting speelse, overdreven, creatieve interpretaties. Spicy ontgrendelt gewaagdere, dramatischere renders. Audio is native in Aurora — dialoog met lipsynchronisatie, achtergrondmuziek en omgevingsgeluid worden samen in één forward pass gegenereerd, zonder aparte nabewerking. Op 2 maart 2026 lanceerde xAI Extend from Frame, dat clips aaneenschakelt door het laatste frame van een clip als startframe van de volgende te gebruiken; het model levert in gemiddeld zo'n 30 seconden een clip van 6 of 10 seconden. Generatie loopt asynchroon in LoveGen AI — dien de taak in en de voltooide video verschijnt in je galerij voor preview, download en directe vergelijking met Sora 2, Veo 3.1, Seedance 2.0 en Happy Horse 1.0 in dezelfde werkruimte.
Hoe Grok Imagine te gebruiken
Stap 1: Kies Tekst-naar-video of Beeld-naar-video
Wissel tussen tekst-naar-video voor generatie alleen op basis van prompt, of beeld-naar-video om een geüpload referentiebeeld te animeren.
Stap 2: Kies je instellingen
Selecteer duur (6s of 10s), resolutie (480p of 720p), beeldverhouding (alleen T2V) en stijlmodus (Fun of Normal).
Stap 3: Genereren en downloaden
Klik op Genereren. Aurora levert in ongeveer 30 seconden een voltooide clip met native audio — preview, download of vergelijk zij aan zij met andere modellen in je galerij.
Grok Imagine technische specificaties
| Aanbieder | xAI |
| Engine | Aurora — autoregressieve framevoorspelling |
| Laatste versie | Grok Imagine 1.0 (algemene beschikbaarheid op 2 februari 2026) |
| Trainingsinfrastructuur | Colossus-supercomputer, 110.000 NVIDIA GB200 GPU's |
| Invoermodi | Tekst-naar-video, Beeld-naar-video |
| Stijlmodi | Fun, Normal, Spicy |
| Videoduur | 6 of 10 seconden (xAI biedt via Extend from Frame ook 15s) |
| Resoluties | 480p, 720p |
| Beeldsnelheid | 24 fps |
| Beeldverhoudingen (T2V) | 16:9, 9:16, 1:1, 3:2, 2:3 |
| Beeldinvoer (I2V) | 1 beeld — JPG / JPEG / PNG / WebP, tot 20 MB |
| Audio | Native — dialoog (met lipsynchronisatie), achtergrondmuziek, geluidseffecten |
| Generatiesnelheid | ~30 seconden gemiddeld per clip |
| Geldigheid van het resultaat | Gegenereerde video-links blijven 24 uur na voltooiing geldig |
Waarom Grok Imagine kiezen
Aurora autoregressieve engine
Grok Imagine is gebouwd op Aurora, xAI's frame-voor-frame autoregressieve videomodel getraind op 110.000 NVIDIA GB200 GPU's — een fundamenteel andere benadering dan diffusie-gebaseerde concurrenten en een belangrijke reden waarom de beweging onderscheidend aanvoelt.
Drie stijlmodi standaard
Fun, Normal en Spicy laten je de creatieve toon bijstellen zonder de prompt te herschrijven. De meeste videomodellen geven één look; Grok Imagine geeft er drie vanuit dezelfde invoer.
Native audio in één pass
Dialoog met lipsynchronisatie, omgevingsgeluid en achtergrondmuziek worden samen met de video geproduceerd — geen aparte audiofase, geen synchronisatieafwijking.
Grok Imagine vs andere AI-videogenerators
| Feature | Grok Imagine | Sora 2 | Veo 3.1 | Seedance 2.0 |
|---|---|---|---|---|
| Aanbieder | xAI | OpenAI | Google DeepMind | ByteDance |
| Architectuur | Aurora (autoregressief) | Diffusie | Diffusie | Diffusie |
| Max. resolutie | 720p | 1080p | 1080p | 1080p |
| Duuropties | 6s, 10s (15s via Extend) | 4s, 8s, 12s | 4s, 6s, 8s | 4-15s |
| Stijlmodi | Fun, Normal, Spicy | Eén modus | Eén modus | Eén modus |
| Beeldinvoer | 1 beeld (I2V) | 1 beeld + Cameos | Tot 3 beelden | 1–2 beelden |
| Beeldverhoudingen (T2V) | 16:9, 9:16, 1:1, 3:2, 2:3 | 16:9, 9:16, 1:1, 3:2, 2:3 | 16:9, 9:16 | 16:9, 9:16, 1:1, +4 meer |
| Native audio | Ja | Ja | Ja | Ja |
| Gemiddelde generatiesnelheid | ~30s | ~60s | ~45s | ~40s |
Perfect voor creators, marketeers en verhalenvertellers
Social media-clips
Genereer korte 6 of 10 seconden video's in 9:16 of 1:1 voor TikTok, Reels en Shorts. Kies de Fun-modus voor energieke, scrollstoppende content met native audio inbegrepen.
Beeldanimaties
Upload een bestaande foto of illustratie en zet die om naar een bewegende sequentie — perfect voor productfoto's, character art of behind-the-scenes-stills.
Conceptboards
Genereer snel meerdere stilistische versies van dezelfde scène in 480p, leg de gewenste richting vast en render opnieuw in 720p — ideaal voor ideation en pitches.
Advertenties en promo's
Gebruik 16:9 horizontaal voor hero-plaatsingen en 9:16 verticaal voor verticale kanalen. De stijlmodusschakelaar laat je de merktoon afstemmen — speels of evenwichtig — zonder de prompt te herschrijven.
Storyboarding
Visualiseer scriptbeats snel als 6-seconden clips met gesynchroniseerde dialoog. Itereer kader en beweging voor je je vastlegt op een langer model.
Educatieve content
Animeer diagrammen, foto's en concept-illustraties tot korte, boeiende clips met native voice-over die de aandacht beter vasthoudt dan statische slides.
Verken gerelateerde AI-videogenerators

Sora 2
OpenAI's filmische videogenerator met fysiek correcte beweging en 20s duur.

Veo 3.1
Google DeepMind's 1080p-videomodel met frames-naar-video en audiogeneratie.

Seedance 2.0
ByteDance's videomodel met geïntegreerde webzoek en gesynchroniseerde audio.
Happy Horse 1.0
Alibaba's #1-videomodel met filmische bewegingskwaliteit en lipsync in 7 talen.
Kling 2.5 Turbo
Kuaishou's snelle 1080p-videogenerator, geoptimaliseerd voor snelheid en kostenefficiëntie.

Veo 4
Google's volgende generatie videomodel met 4K-upscaling en spatial audio.
Veelgestelde vragen over Grok Imagine
Wat is Grok Imagine?
Grok Imagine is xAI's videogeneratiemodel, gebouwd op de autoregressieve Aurora-engine en getraind op de Colossus-supercomputer met 110.000 NVIDIA GB200 GPU's. Het ondersteunt tekst-naar-video en beeld-naar-video, met drie creatieve stijlmodi — Fun, Normal en Spicy — die de toon van elke prompt veranderen.
Wanneer is Grok Imagine uitgebracht?
Grok Imagine ging in 2025 in preview en bereikte op 2 februari 2026 versie 1.0 met algemene beschikbaarheid. xAI blijft updates uitbrengen — meest recent Extend from Frame op 2 maart 2026, dat clips aaneenschakelt voor sequenties tot 15 seconden per geketende clip.
Welke duur en resoluties worden ondersteund?
Grok Imagine genereert clips van 6 of 10 seconden in 480p of 720p, gerenderd op 24 fps. De gemiddelde generatietijd is rond de 30 seconden per clip.
Welke beeldverhoudingen zijn beschikbaar?
Tekst-naar-video ondersteunt 16:9, 9:16, 1:1, 3:2 en 2:3 — voor liggende, staande, vierkante en klassieke fotografische uitsnedes. Beeld-naar-video behoudt de beeldverhouding van het door jou geüploade referentiebeeld.
Wat is het verschil tussen Fun, Normal en Spicy modi?
Normal levert gebalanceerde, trouwe resultaten. Fun gaat richting speelse, overdreven, creatieve interpretaties. Spicy ontgrendelt gewaagdere, dramatischere uitvoer. Dezelfde prompt in verschillende modi kan merkbaar andere filmische sferen produceren.
Genereert Grok Imagine audio?
Ja. Aurora produceert native gesynchroniseerde dialoog met lipsynchronisatie, achtergrondmuziek en omgevingsgeluid in één forward pass — geen aparte nabewerking nodig.