Loading

Grok Imagine — مولّد فيديو بالذكاء الاصطناعي

أنشئ مقاطع فيديو ذكاء اصطناعي مميزة بمحرك Aurora من xAI داخل Grok Imagine

Grok Imagine هو نموذج توليد الفيديو من xAI، مدعوم بمحرك Aurora التوليدي التتابعي، ومدرَّب على حاسوب Colossus العملاق باستخدام 110,000 وحدة معالجة رسومات NVIDIA GB200. ينتج مقاطع 6 أو 10 ثوانٍ بدقة 480p أو 720p مع صوت أصلي، ويدعم النص إلى فيديو والصورة إلى فيديو، ويوفّر ثلاثة أنماط مميزة — Fun وNormal وSpicy — لتغيير النبرة الإبداعية لأي موجِّه بنقرة واحدة.

أصبح Grok Imagine 1.0 متاحاً للجميع في 2 فبراير 2026، بعد إطلاقه كنسخة أولية في 2025. يعتمد النموذج على Aurora، معمارية xAI التوليدية التتابعية للتنبؤ بالإطارات، التي تُصيِّر بشكل متسلسل من اليسار إلى اليمين بدلاً من الانتشار. استخدم التدريب حاسوب Colossus العملاق و110,000 وحدة NVIDIA GB200 — إحدى أكبر بنى التدريب في مجال فيديو الذكاء الاصطناعي حتى الآن — وقد أنتجت المنصة العامة بالفعل أكثر من 1.245 مليار مقطع فيديو في نافذة 30 يوماً واحدة.

يقدّم النموذج وضعَين للإدخال داخل LoveGen AI. النص إلى فيديو يقبل موجِّهاً يصل إلى 2,000 حرف ويُصيِّر الحركة بخمس نسب أبعاد — 16:9 و9:16 و1:1 و3:2 و2:3 — تغطي الأطر الأفقية والعمودية والمربعة وتأطيرات التصوير الكلاسيكية. الصورة إلى فيديو يقبل صورة مرجعية واحدة (JPG أو JPEG أو PNG أو WebP، حتى 20 ميغابايت) ويحرّكها وفقاً للموجِّه. يُصيِّر الوضعان عند 24 إطاراً/ثانية بمدد 6 أو 10 ثوانٍ، بإخراج يصل إلى 720p.

الميزة المميِّزة هي مفتاح أنماط الأسلوب. النمط Normal يحافظ على نتيجة متوازنة ووفيّة للموجِّه. النمط Fun يميل نحو التفسيرات المرحة والمبالغ فيها والإبداعية. النمط Spicy يفتح إخراجاً أكثر جرأة ودراما. الصوت أصلي في Aurora — حوار متزامن مع حركة الشفاه، وموسيقى تصويرية، ومؤثرات بيئية تُولَّد معاً في تمريرة أمامية واحدة بلا معالجة لاحقة منفصلة. في 2 مارس 2026 أطلقت xAI ميزة Extend from Frame التي تربط المقاطع باستخدام آخر إطار من مقطع كبداية للمقطع التالي؛ يعيد النموذج مقطعاً من 6 أو 10 ثوانٍ في نحو 30 ثانية في المتوسط. يعمل التوليد بشكل غير متزامن داخل LoveGen AI — أرسل المهمة وسيظهر الفيديو المكتمل في معرضك للمعاينة والتنزيل والمقارنة مباشرةً مع Sora 2 وVeo 3.1 وSeedance 2.0 وHappy Horse 1.0 في مساحة العمل نفسها.

كيفية استخدام Grok Imagine

01

الخطوة 1: اختر نص إلى فيديو أو صورة إلى فيديو

بدِّل بين النص إلى فيديو للتوليد بالموجِّه فقط، أو الصورة إلى فيديو لتحريك صورة مرجعية ترفعها.

02

الخطوة 2: اختر إعداداتك

حدِّد المدة (6 ث أو 10 ث)، الدقة (480p أو 720p)، نسبة الأبعاد (T2V فقط)، ونمط الأسلوب (Fun أو Normal).

03

الخطوة 3: التوليد والتنزيل

انقر فوق توليد. يعيد Aurora مقطعاً مكتملاً مع صوت أصلي في نحو 30 ثانية — عاينه أو نزِّله أو قارنه جنباً إلى جنب مع نماذج أخرى في معرضك.

المواصفات التقنية لـ Grok Imagine

المزوِّدxAI
المحركAurora — تنبؤ الإطارات التوليدي التتابعي
أحدث إصدارGrok Imagine 1.0 (الإتاحة العامة في 2 فبراير 2026)
بنية التدريبحاسوب Colossus العملاق، 110,000 وحدة NVIDIA GB200
أوضاع الإدخالنص إلى فيديو، صورة إلى فيديو
أنماط الأسلوبFun, Normal, Spicy
مدة الفيديو6 أو 10 ثوانٍ (وتقدّم xAI أيضاً 15 ثانية عبر Extend from Frame)
الدقة480p, 720p
معدل الإطارات24 fps
نسب الأبعاد (T2V)16:9, 9:16, 1:1, 3:2, 2:3
إدخال الصورة (I2V)صورة واحدة — JPG / JPEG / PNG / WebP، حتى 20 ميغابايت
الصوتأصلي — حوار (مع تزامن الشفاه)، موسيقى تصويرية، مؤثرات صوتية
سرعة التوليدنحو 30 ثانية في المتوسط لكل مقطع
صلاحية النتيجةتظل روابط الفيديو المُولَّد صالحة لمدة 24 ساعة بعد الانتهاء

لماذا تختار Grok Imagine

محرك Aurora التوليدي التتابعي

Grok Imagine مبني على Aurora، نموذج فيديو xAI التوليدي التتابعي إطاراً بإطار، مدرَّب على 110,000 وحدة NVIDIA GB200 — مقاربة مختلفة جوهرياً عن المنافسين القائمين على الانتشار وسبب رئيسي لتميُّز إحساس الحركة فيه.

ثلاثة أنماط أسلوب جاهزة

Fun وNormal وSpicy تتيح ضبط النبرة الإبداعية دون إعادة كتابة الموجِّه. تقدّم معظم نماذج الفيديو مظهراً واحداً؛ بينما يمنحك Grok Imagine ثلاثة من المدخل نفسه.

صوت أصلي في تمريرة واحدة

حوار مع تزامن الشفاه وأصوات بيئية وموسيقى تصويرية تُنتَج مع الفيديو — لا مرحلة صوت منفصلة ولا انحراف في التزامن.

Grok Imagine مقابل مولّدات الفيديو الأخرى بالذكاء الاصطناعي

FeatureGrok ImagineSora 2Veo 3.1Seedance 2.0
المزوِّدxAIOpenAIGoogle DeepMindByteDance
المعماريةAurora (توليدي تتابعي)انتشارانتشارانتشار
أقصى دقة720p1080p1080p1080p
خيارات المدة6 ث، 10 ث (15 ث عبر Extend)4s, 8s, 12s4s, 6s, 8s4-15s
أنماط الأسلوبFun, Normal, Spicyوضع واحدوضع واحدوضع واحد
إدخال الصورةصورة 1 (I2V)صورة 1 + Cameosحتى 3 صور1–2 صور
نسب الأبعاد (T2V)16:9, 9:16, 1:1, 3:2, 2:316:9, 9:16, 1:1, 3:2, 2:316:9, 9:1616:9، 9:16، 1:1، +4 أخرى
صوت أصلينعمنعمنعمنعم
متوسط سرعة التوليد~30s~60s~45s~40s

مثالي للمبدعين والمسوّقين ورواة القصص

01

مقاطع وسائل التواصل

أنشئ مقاطع قصيرة من 6 أو 10 ثوانٍ بنسبة 9:16 أو 1:1 لـ TikTok وReels وShorts. اختر وضع Fun لمحتوى نشِط يوقف التمرير، مع صوت أصلي مدمج.

02

تحريك الصور

ارفع صورة فوتوغرافية أو رسماً موجوداً وحوِّله إلى تسلسل متحرك — مثالي لصور المنتجات وفنون الشخصيات ولقطات ما وراء الكواليس.

03

لوحات الأفكار

أنشئ بسرعة عدة نسخ أسلوبية للمشهد نفسه بدقة 480p، ثبِّت الاتجاه الذي يعجبك، ثم أعد التصيير بدقة 720p — مثالي للعصف الذهني والعروض.

04

إعلانات وعروض ترويجية

استخدم 16:9 الأفقي للوضع البطل و9:16 العمودي للقنوات العمودية. يتيح لك مفتاح الأسلوب ضبط نبرة العلامة — مرحة أو متزنة — دون إعادة كتابة الموجِّه.

05

اللوحات القصصية

صوِّر إيقاعات السيناريو بسرعة كمقاطع 6 ثوانٍ مع حوار متزامن. كرِّر التأطير والحركة قبل الالتزام بنموذج أطول.

06

المحتوى التعليمي

حرِّك الرسوم البيانية والصور والرسوم التوضيحية المفاهيمية في مقاطع قصيرة جذابة بصوت تعليق أصلي يثبّت الانتباه أكثر من الشرائح الثابتة.

استكشف مولّدات فيديو ذكاء اصطناعي ذات صلة

الأسئلة الشائعة حول Grok Imagine

ما هو Grok Imagine؟

Grok Imagine هو نموذج توليد الفيديو من xAI، قائم على محرك Aurora التوليدي التتابعي ومدرَّب على حاسوب Colossus العملاق بـ110,000 وحدة NVIDIA GB200. يدعم النص إلى فيديو والصورة إلى فيديو، مع ثلاثة أنماط إبداعية — Fun وNormal وSpicy — تغيِّر نبرة أي موجِّه.

متى صدر Grok Imagine؟

أُطلق Grok Imagine كنسخة أولية في 2025، ووصل إلى الإصدار 1.0 بإتاحة عامة في 2 فبراير 2026. تواصل xAI إصدار التحديثات — وآخرها Extend from Frame في 2 مارس 2026، الذي يربط المقاطع لتسلسلات تصل إلى 15 ثانية لكل مقطع مرتبط.

ما المدد والدقات المدعومة؟

يولِّد Grok Imagine مقاطع 6 أو 10 ثوانٍ بدقة 480p أو 720p بمعدل 24 إطاراً/ثانية. متوسط زمن التوليد نحو 30 ثانية لكل مقطع.

ما نسب الأبعاد المتاحة؟

النص إلى فيديو يدعم 16:9 و9:16 و1:1 و3:2 و2:3 — تغطي الأطر الأفقية والعمودية والمربعة وتأطيرات التصوير الكلاسيكية. الصورة إلى فيديو يحافظ على نسبة الأبعاد للصورة المرجعية التي ترفعها.

ما الفرق بين أنماط Fun وNormal وSpicy؟

النمط Normal ينتج نتائج متوازنة ووفية. النمط Fun يميل إلى تفسيرات مرحة ومبالغ فيها وإبداعية. النمط Spicy يفتح إخراجاً أكثر جرأة ودراما. قد يُنتج الموجِّه نفسه في أوضاع مختلفة أجواءً سينمائية متباينة بشكل ملحوظ.

هل يولِّد Grok Imagine صوتاً؟

نعم. يُنتج Aurora أصلاً حواراً متزامناً مع حركة الشفاه وموسيقى تصويرية ومؤثرات بيئية في تمريرة أمامية واحدة — لا حاجة إلى خطوة معالجة لاحقة منفصلة.