Loading

ИИ-видеогенератор Grok Imagine

Создавайте стилизованные ИИ-видео с движком Aurora от xAI в Grok Imagine

Grok Imagine — это модель генерации видео от xAI, работающая на авторегрессивном движке Aurora и обученная на суперкомпьютере Colossus с 110 000 GPU NVIDIA GB200. Создаёт клипы 6 или 10 секунд в 480p или 720p с нативным звуком, поддерживает текст в видео и изображение в видео, и предлагает три самостоятельных стиля — Fun, Normal и Spicy — позволяя одним кликом менять творческую тональность любого промпта.

Grok Imagine 1.0 стал общедоступным 2 февраля 2026 года после превью-релиза в 2025. Модель построена на Aurora — авторегрессивной архитектуре предсказания кадров от xAI, рендерящей последовательно слева направо вместо диффузии. Обучение проводилось на суперкомпьютере Colossus с 110 000 GPU NVIDIA GB200 — это одна из крупнейших инфраструктур обучения в области ИИ-видео на сегодняшний день, — а на публичной платформе уже создано более 1,245 миллиарда видео в одном 30-дневном окне.

Модель предлагает два режима ввода в LoveGen AI. Текст в видео принимает промпт до 2 000 символов и рендерит движение в пяти соотношениях сторон — 16:9, 9:16, 1:1, 3:2 и 2:3 — охватывая горизонтальные, вертикальные, квадратные и классические фотографические форматы. Изображение в видео принимает одну референсную картинку (JPG, JPEG, PNG или WebP, до 20 МБ) и анимирует её согласно вашему промпту. Оба режима выдают 24 fps в длительности 6 или 10 секунд, с выводом до 720p.

Ключевая особенность — переключатель стилей. Normal сохраняет результат сбалансированным и верным промпту. Fun уводит к игривым, преувеличенным и креативным интерпретациям. Spicy открывает более смелые и драматичные рендеры. Звук нативно встроен в Aurora — диалог с липсинком, фоновая музыка и эмбиент-эффекты генерируются вместе за один прямой проход, без отдельной постобработки. 2 марта 2026 года xAI выпустила Extend from Frame, которая связывает клипы, используя последний кадр одного как стартовый кадр следующего; модель возвращает 6- или 10-секундный клип примерно за 30 секунд в среднем. Генерация в LoveGen AI идёт асинхронно — отправьте задачу, и готовое видео появится в вашей галерее, где его можно предпросмотреть, скачать и сравнить напрямую с Sora 2, Veo 3.1, Seedance 2.0 и Happy Horse 1.0 в одном рабочем пространстве.

Как использовать Grok Imagine

01

Шаг 1: Выберите Текст в видео или Изображение в видео

Переключайтесь между текст-в-видео для генерации только по промпту и изображение-в-видео, чтобы анимировать загруженный референс.

02

Шаг 2: Выберите настройки

Выберите длительность (6с или 10с), разрешение (480p или 720p), соотношение сторон (только T2V) и режим стиля (Fun или Normal).

03

Шаг 3: Сгенерировать и скачать

Нажмите Generate. Aurora возвращает готовый клип с нативным звуком примерно за 30 секунд — предпросмотр, скачивание или сравнение с другими моделями в галерее.

Технические характеристики Grok Imagine

ПоставщикxAI
ДвижокAurora — авторегрессивное предсказание кадров
Последняя версияGrok Imagine 1.0 (общедоступно с 2 февраля 2026)
Инфраструктура обученияСуперкомпьютер Colossus, 110 000 GPU NVIDIA GB200
Режимы вводаТекст в видео, Изображение в видео
Режимы стиляFun, Normal, Spicy
Длительность видео6 или 10 секунд (xAI также предлагает 15с через Extend from Frame)
Разрешения480p, 720p
Частота кадров24 fps
Соотношения сторон (T2V)16:9, 9:16, 1:1, 3:2, 2:3
Ввод изображения (I2V)1 изображение — JPG / JPEG / PNG / WebP, до 20 МБ
АудиоНативно — диалог (с липсинком), фоновая музыка, звуковые эффекты
Скорость генерации~30 секунд в среднем на клип
Срок действия результатаСсылки на сгенерированное видео остаются действительными в течение 24 часов после завершения

Почему стоит выбрать Grok Imagine

Авторегрессивный движок Aurora

Grok Imagine построен на Aurora, покадровой авторегрессивной видеомодели xAI, обученной на 110 000 GPU NVIDIA GB200 — принципиально иной подход по сравнению с конкурентами на диффузии и ключевая причина уникального ощущения движения.

Три режима стиля из коробки

Fun, Normal и Spicy позволяют менять творческий тон без переписывания промпта. Большинство видеомоделей дают один внешний вид; Grok Imagine выдаёт три из одного и того же ввода.

Нативное аудио за один проход

Диалог с липсинком, эмбиент и фоновая музыка создаются вместе с видео — без отдельной аудиостадии и расхождения по синхронизации.

Grok Imagine vs другие ИИ-видеогенераторы

FeatureGrok ImagineSora 2Veo 3.1Seedance 2.0
ПоставщикxAIOpenAIGoogle DeepMindByteDance
АрхитектураAurora (авторегрессия)ДиффузияДиффузияДиффузия
Макс. разрешение720p1080p1080p1080p
Варианты длительности6с, 10с (15с через Extend)4s, 8s, 12s4s, 6s, 8s4-15s
Режимы стиляFun, Normal, SpicyОдин режимОдин режимОдин режим
Ввод изображения1 изображение (I2V)1 изображение + CameosДо 3 изображений1–2 изображения
Соотношения сторон (T2V)16:9, 9:16, 1:1, 3:2, 2:316:9, 9:16, 1:1, 3:2, 2:316:9, 9:1616:9, 9:16, 1:1, +4 ещё
Нативное аудиоДаДаДаДа
Средняя скорость генерации~30s~60s~45s~40s

Идеально для авторов, маркетологов и сторителлеров

01

Клипы для соцсетей

Создавайте короткие видео по 6 или 10 секунд в 9:16 или 1:1 для TikTok, Reels и Shorts. Выбирайте режим Fun для энергичного контента, останавливающего скролл, с нативным звуком прямо в кадре.

02

Анимация изображений

Загрузите существующую фотографию или иллюстрацию и превратите её в движущуюся последовательность — отлично подходит для продуктовых снимков, character art или закулисных кадров.

03

Концепт-доски

Быстро прогоните несколько стилевых вариантов одной сцены в 480p, зафиксируйте понравившееся направление и пере-рендерите в 720p — идеально для идеации и питчей.

04

Реклама и промо

Используйте 16:9 горизонтально для hero-размещений и 9:16 вертикально для вертикальных каналов. Переключатель стилей помогает попасть в тон бренда — игривый или сдержанный — без переписывания промпта.

05

Сторибординг

Быстро визуализируйте такты сценария как 6-секундные клипы с синхронным диалогом. Итерируйте кадрирование и движение, прежде чем переходить к более длинной модели.

06

Образовательный контент

Анимируйте схемы, фотографии и концепт-иллюстрации в короткие увлекательные клипы с нативным закадровым голосом, удерживающим внимание лучше статичных слайдов.

Изучите связанные ИИ-видеогенераторы

Часто задаваемые вопросы о Grok Imagine

Что такое Grok Imagine?

Grok Imagine — это модель генерации видео от xAI, построенная на авторегрессивном движке Aurora и обученная на суперкомпьютере Colossus с 110 000 GPU NVIDIA GB200. Поддерживает текст в видео и изображение в видео, с тремя творческими режимами стиля — Fun, Normal и Spicy — меняющими тональность любого промпта.

Когда вышел Grok Imagine?

Grok Imagine стартовал в превью в 2025 году и достиг версии 1.0 с общедоступностью 2 февраля 2026 года. xAI продолжает выпускать обновления — последнее это Extend from Frame от 2 марта 2026, связывающий клипы в последовательности до 15 секунд на каждый связанный клип.

Какие длительности и разрешения поддерживаются?

Grok Imagine генерирует клипы 6 или 10 секунд в 480p или 720p с частотой 24 fps. Среднее время генерации около 30 секунд на клип.

Какие соотношения сторон доступны?

Текст в видео поддерживает 16:9, 9:16, 1:1, 3:2 и 2:3 — горизонтальное, вертикальное, квадратное и классические фотоформаты. Изображение в видео сохраняет соотношение сторон загруженного вами референса.

В чём разница между режимами Fun, Normal и Spicy?

Normal даёт сбалансированные, верные результаты. Fun склоняется к игривым, преувеличенным и творческим интерпретациям. Spicy открывает более смелые и драматичные результаты. Один и тот же промпт в разных режимах может давать заметно разные кинематографичные настроения.

Генерирует ли Grok Imagine звук?

Да. Aurora нативно создаёт синхронизированный диалог с липсинком, фоновую музыку и эмбиент-эффекты за один прямой проход — отдельный шаг постобработки не нужен.