
Grok Imagine — مولّد فيديو بالذكاء الاصطناعي
أنشئ مقاطع فيديو ذكاء اصطناعي مميزة بمحرك Aurora من xAI داخل Grok Imagine
Grok Imagine هو نموذج توليد الفيديو من xAI، مدعوم بمحرك Aurora التوليدي التتابعي، ومدرَّب على حاسوب Colossus العملاق باستخدام 110,000 وحدة معالجة رسومات NVIDIA GB200. ينتج مقاطع 6 أو 10 ثوانٍ بدقة 480p أو 720p مع صوت أصلي، ويدعم النص إلى فيديو والصورة إلى فيديو، ويوفّر ثلاثة أنماط مميزة — Fun وNormal وSpicy — لتغيير النبرة الإبداعية لأي موجِّه بنقرة واحدة.
أصبح Grok Imagine 1.0 متاحاً للجميع في 2 فبراير 2026، بعد إطلاقه كنسخة أولية في 2025. يعتمد النموذج على Aurora، معمارية xAI التوليدية التتابعية للتنبؤ بالإطارات، التي تُصيِّر بشكل متسلسل من اليسار إلى اليمين بدلاً من الانتشار. استخدم التدريب حاسوب Colossus العملاق و110,000 وحدة NVIDIA GB200 — إحدى أكبر بنى التدريب في مجال فيديو الذكاء الاصطناعي حتى الآن — وقد أنتجت المنصة العامة بالفعل أكثر من 1.245 مليار مقطع فيديو في نافذة 30 يوماً واحدة.
يقدّم النموذج وضعَين للإدخال داخل LoveGen AI. النص إلى فيديو يقبل موجِّهاً يصل إلى 2,000 حرف ويُصيِّر الحركة بخمس نسب أبعاد — 16:9 و9:16 و1:1 و3:2 و2:3 — تغطي الأطر الأفقية والعمودية والمربعة وتأطيرات التصوير الكلاسيكية. الصورة إلى فيديو يقبل صورة مرجعية واحدة (JPG أو JPEG أو PNG أو WebP، حتى 20 ميغابايت) ويحرّكها وفقاً للموجِّه. يُصيِّر الوضعان عند 24 إطاراً/ثانية بمدد 6 أو 10 ثوانٍ، بإخراج يصل إلى 720p.
الميزة المميِّزة هي مفتاح أنماط الأسلوب. النمط Normal يحافظ على نتيجة متوازنة ووفيّة للموجِّه. النمط Fun يميل نحو التفسيرات المرحة والمبالغ فيها والإبداعية. النمط Spicy يفتح إخراجاً أكثر جرأة ودراما. الصوت أصلي في Aurora — حوار متزامن مع حركة الشفاه، وموسيقى تصويرية، ومؤثرات بيئية تُولَّد معاً في تمريرة أمامية واحدة بلا معالجة لاحقة منفصلة. في 2 مارس 2026 أطلقت xAI ميزة Extend from Frame التي تربط المقاطع باستخدام آخر إطار من مقطع كبداية للمقطع التالي؛ يعيد النموذج مقطعاً من 6 أو 10 ثوانٍ في نحو 30 ثانية في المتوسط. يعمل التوليد بشكل غير متزامن داخل LoveGen AI — أرسل المهمة وسيظهر الفيديو المكتمل في معرضك للمعاينة والتنزيل والمقارنة مباشرةً مع Sora 2 وVeo 3.1 وSeedance 2.0 وHappy Horse 1.0 في مساحة العمل نفسها.
كيفية استخدام Grok Imagine
الخطوة 1: اختر نص إلى فيديو أو صورة إلى فيديو
بدِّل بين النص إلى فيديو للتوليد بالموجِّه فقط، أو الصورة إلى فيديو لتحريك صورة مرجعية ترفعها.
الخطوة 2: اختر إعداداتك
حدِّد المدة (6 ث أو 10 ث)، الدقة (480p أو 720p)، نسبة الأبعاد (T2V فقط)، ونمط الأسلوب (Fun أو Normal).
الخطوة 3: التوليد والتنزيل
انقر فوق توليد. يعيد Aurora مقطعاً مكتملاً مع صوت أصلي في نحو 30 ثانية — عاينه أو نزِّله أو قارنه جنباً إلى جنب مع نماذج أخرى في معرضك.
المواصفات التقنية لـ Grok Imagine
| المزوِّد | xAI |
| المحرك | Aurora — تنبؤ الإطارات التوليدي التتابعي |
| أحدث إصدار | Grok Imagine 1.0 (الإتاحة العامة في 2 فبراير 2026) |
| بنية التدريب | حاسوب Colossus العملاق، 110,000 وحدة NVIDIA GB200 |
| أوضاع الإدخال | نص إلى فيديو، صورة إلى فيديو |
| أنماط الأسلوب | Fun, Normal, Spicy |
| مدة الفيديو | 6 أو 10 ثوانٍ (وتقدّم xAI أيضاً 15 ثانية عبر Extend from Frame) |
| الدقة | 480p, 720p |
| معدل الإطارات | 24 fps |
| نسب الأبعاد (T2V) | 16:9, 9:16, 1:1, 3:2, 2:3 |
| إدخال الصورة (I2V) | صورة واحدة — JPG / JPEG / PNG / WebP، حتى 20 ميغابايت |
| الصوت | أصلي — حوار (مع تزامن الشفاه)، موسيقى تصويرية، مؤثرات صوتية |
| سرعة التوليد | نحو 30 ثانية في المتوسط لكل مقطع |
| صلاحية النتيجة | تظل روابط الفيديو المُولَّد صالحة لمدة 24 ساعة بعد الانتهاء |
لماذا تختار Grok Imagine
محرك Aurora التوليدي التتابعي
Grok Imagine مبني على Aurora، نموذج فيديو xAI التوليدي التتابعي إطاراً بإطار، مدرَّب على 110,000 وحدة NVIDIA GB200 — مقاربة مختلفة جوهرياً عن المنافسين القائمين على الانتشار وسبب رئيسي لتميُّز إحساس الحركة فيه.
ثلاثة أنماط أسلوب جاهزة
Fun وNormal وSpicy تتيح ضبط النبرة الإبداعية دون إعادة كتابة الموجِّه. تقدّم معظم نماذج الفيديو مظهراً واحداً؛ بينما يمنحك Grok Imagine ثلاثة من المدخل نفسه.
صوت أصلي في تمريرة واحدة
حوار مع تزامن الشفاه وأصوات بيئية وموسيقى تصويرية تُنتَج مع الفيديو — لا مرحلة صوت منفصلة ولا انحراف في التزامن.
Grok Imagine مقابل مولّدات الفيديو الأخرى بالذكاء الاصطناعي
| Feature | Grok Imagine | Sora 2 | Veo 3.1 | Seedance 2.0 |
|---|---|---|---|---|
| المزوِّد | xAI | OpenAI | Google DeepMind | ByteDance |
| المعمارية | Aurora (توليدي تتابعي) | انتشار | انتشار | انتشار |
| أقصى دقة | 720p | 1080p | 1080p | 1080p |
| خيارات المدة | 6 ث، 10 ث (15 ث عبر Extend) | 4s, 8s, 12s | 4s, 6s, 8s | 4-15s |
| أنماط الأسلوب | Fun, Normal, Spicy | وضع واحد | وضع واحد | وضع واحد |
| إدخال الصورة | صورة 1 (I2V) | صورة 1 + Cameos | حتى 3 صور | 1–2 صور |
| نسب الأبعاد (T2V) | 16:9, 9:16, 1:1, 3:2, 2:3 | 16:9, 9:16, 1:1, 3:2, 2:3 | 16:9, 9:16 | 16:9، 9:16، 1:1، +4 أخرى |
| صوت أصلي | نعم | نعم | نعم | نعم |
| متوسط سرعة التوليد | ~30s | ~60s | ~45s | ~40s |
مثالي للمبدعين والمسوّقين ورواة القصص
مقاطع وسائل التواصل
أنشئ مقاطع قصيرة من 6 أو 10 ثوانٍ بنسبة 9:16 أو 1:1 لـ TikTok وReels وShorts. اختر وضع Fun لمحتوى نشِط يوقف التمرير، مع صوت أصلي مدمج.
تحريك الصور
ارفع صورة فوتوغرافية أو رسماً موجوداً وحوِّله إلى تسلسل متحرك — مثالي لصور المنتجات وفنون الشخصيات ولقطات ما وراء الكواليس.
لوحات الأفكار
أنشئ بسرعة عدة نسخ أسلوبية للمشهد نفسه بدقة 480p، ثبِّت الاتجاه الذي يعجبك، ثم أعد التصيير بدقة 720p — مثالي للعصف الذهني والعروض.
إعلانات وعروض ترويجية
استخدم 16:9 الأفقي للوضع البطل و9:16 العمودي للقنوات العمودية. يتيح لك مفتاح الأسلوب ضبط نبرة العلامة — مرحة أو متزنة — دون إعادة كتابة الموجِّه.
اللوحات القصصية
صوِّر إيقاعات السيناريو بسرعة كمقاطع 6 ثوانٍ مع حوار متزامن. كرِّر التأطير والحركة قبل الالتزام بنموذج أطول.
المحتوى التعليمي
حرِّك الرسوم البيانية والصور والرسوم التوضيحية المفاهيمية في مقاطع قصيرة جذابة بصوت تعليق أصلي يثبّت الانتباه أكثر من الشرائح الثابتة.
استكشف مولّدات فيديو ذكاء اصطناعي ذات صلة

Sora 2
مولِّد فيديو سينمائي من OpenAI بحركة دقيقة فيزيائياً ومدة 20 ثانية.

Veo 3.1
نموذج فيديو 1080p من Google DeepMind مع تحويل الإطارات إلى فيديو وتوليد الصوت.

Seedance 2.0
نموذج فيديو من ByteDance مع تكامل البحث على الويب وصوت متزامن.
Happy Horse 1.0
نموذج Alibaba رقم 1 بجودة حركة سينمائية وتزامن شفاه بسبع لغات.
Kling 2.5 Turbo
مولّد فيديو 1080p سريع من Kuaishou، محسَّن للسرعة وكفاءة التكلفة.

Veo 4
نموذج فيديو الجيل التالي من Google مع رفع دقة 4K وصوت مكاني.
الأسئلة الشائعة حول Grok Imagine
ما هو Grok Imagine؟
Grok Imagine هو نموذج توليد الفيديو من xAI، قائم على محرك Aurora التوليدي التتابعي ومدرَّب على حاسوب Colossus العملاق بـ110,000 وحدة NVIDIA GB200. يدعم النص إلى فيديو والصورة إلى فيديو، مع ثلاثة أنماط إبداعية — Fun وNormal وSpicy — تغيِّر نبرة أي موجِّه.
متى صدر Grok Imagine؟
أُطلق Grok Imagine كنسخة أولية في 2025، ووصل إلى الإصدار 1.0 بإتاحة عامة في 2 فبراير 2026. تواصل xAI إصدار التحديثات — وآخرها Extend from Frame في 2 مارس 2026، الذي يربط المقاطع لتسلسلات تصل إلى 15 ثانية لكل مقطع مرتبط.
ما المدد والدقات المدعومة؟
يولِّد Grok Imagine مقاطع 6 أو 10 ثوانٍ بدقة 480p أو 720p بمعدل 24 إطاراً/ثانية. متوسط زمن التوليد نحو 30 ثانية لكل مقطع.
ما نسب الأبعاد المتاحة؟
النص إلى فيديو يدعم 16:9 و9:16 و1:1 و3:2 و2:3 — تغطي الأطر الأفقية والعمودية والمربعة وتأطيرات التصوير الكلاسيكية. الصورة إلى فيديو يحافظ على نسبة الأبعاد للصورة المرجعية التي ترفعها.
ما الفرق بين أنماط Fun وNormal وSpicy؟
النمط Normal ينتج نتائج متوازنة ووفية. النمط Fun يميل إلى تفسيرات مرحة ومبالغ فيها وإبداعية. النمط Spicy يفتح إخراجاً أكثر جرأة ودراما. قد يُنتج الموجِّه نفسه في أوضاع مختلفة أجواءً سينمائية متباينة بشكل ملحوظ.
هل يولِّد Grok Imagine صوتاً؟
نعم. يُنتج Aurora أصلاً حواراً متزامناً مع حركة الشفاه وموسيقى تصويرية ومؤثرات بيئية في تمريرة أمامية واحدة — لا حاجة إلى خطوة معالجة لاحقة منفصلة.