
Google DeepMind
Gemini Omni
لم تُصدره Google رسمياً بعد
Google's unified omni-model for video generation is launching soon on LoveGen AI.
منشئ الفيديو بالذكاء الاصطناعي Gemini Omni
أنشئ وحرّر مقاطع فيديو بالذكاء الاصطناعي مع نموذج omni الموحد من Google
Gemini Omni هو نموذج توليد الفيديو الموحد القادم من Google DeepMind، شوهد لأول مرة كسلسلة في واجهة مستخدم تطبيق Gemini قبيل Google I/O 2026. على خلاف نماذج Veo المتخصصة، يبدو أن Gemini Omni مبني على بنية omni موحدة تتعامل مع النص والصورة والفيديو والصوت في نظام واحد. استناداً إلى عروض توضيحية مسربة، يدعم الصوت المتزامن الأصلي وتحرير الفيديو عبر الدردشة — المواصفات الدقيقة تخضع للإعلان الرسمي.
اكتُشف Gemini Omni كسلسلة في واجهة مستخدم تطبيق Gemini في مايو 2026، قبل أيام قليلة من Google I/O 2026 (المقرر في 19-20 مايو). لم تُعلن Google رسمياً عن النموذج، وجميع المعلومات أدناه مستندة إلى عروض وسلاسل واجهة مستخدم مسربة وليس وثائق رسمية. المواصفات والأسعار والتوافر تخضع للإصدار الرسمي.
من التسريبات المتاحة، يبدو أن النموذج يدعم تحرير الفيديو عبر الدردشة كميزة أساسية. يبدو أن المستخدمين يستطيعون وصف التغييرات بلغة طبيعية — على سبيل المثال إزالة علامة مائية، أو استبدال كائن بآخر، أو إعادة كتابة مشهد بأكمله — ويطبق النموذج التعديل دون عمل يدوي إطاراً بإطار. تضمنت المواد التوضيحية المسربة مشهداً لرجلين يتناولان السباغيتي في مطعم فاخر وأستاذ يكتب براهين رياضية على السبورة أثناء السرد.
يبدو أن الصوت المتزامن الأصلي يُنتج في تمريرة واحدة: حوار بمزامنة الشفاه وتأثيرات صوتية على الشاشة وصوت خلفية محيطة — كل ذلك معاً دون مرحلة معالجة TTS أو Foley منفصلة. كانت مكتبة قوالب جاهزة للبدء السريع مرئية أيضاً في واجهة المستخدم المسربة للتطبيق.
جميع المواصفات التقنية — بما فيها الدقة والمدة ومعدل الإطارات ونسب العرض إلى الارتفاع والأسعار — لم تُؤكد رسمياً وستُعلن لاحقاً. ستدمج LoveGen AI نموذج Gemini Omni فور إتاحة API للعموم.
كيفية استخدام Gemini Omni
الخطوة 1: اختر وضع الإنشاء
اختر نصاً إلى فيديو للإنشاء من موجه، أو صورة إلى فيديو لتحريك صورة مرجعية، أو اختر قالباً جاهزاً للبدء السريع.
الخطوة 2: صِف فيديوك أو تعديلك
اكتب موجهاً تفصيلياً أو صِف تعديلاً بلغة عادية — يفهم Gemini Omni تغييرات المشاهد باللغة الطبيعية واستبدال الكائنات وتعديلات الأسلوب عبر الدردشة.
الخطوة 3: أنشئ وحسّن
انقر على إنشاء. سيُعيد Gemini Omni فيديو مع صوت متزامن أصلي. استخدم محرر الدردشة لتحسين عناصر محددة دون البدء من جديد.
المواصفات التقنية لـ Gemini Omni
| المزود | Google DeepMind |
| البنية | نموذج omni موحد (نص + صورة + فيديو + صوت) — يخضع للتأكيد الرسمي |
| الحالة الحالية | لم يُعلن رسمياً بعد — شوهد في واجهة مستخدم مسربة، مايو 2026 |
| الإعلان المتوقع | Google I/O 2026 (19-20 مايو 2026) |
| أوضاع الإدخال | نص إلى فيديو، صورة إلى فيديو، تحرير قائم على الدردشة (استناداً إلى تسريبات — TBD) |
| تحرير الفيديو | عبر الدردشة: استبدال الكائنات، إزالة العلامات المائية، إعادة كتابة المشاهد (استناداً إلى تسريبات — TBD) |
| القوالب | مكتبة قوالب جاهزة (استناداً إلى واجهة مستخدم مسربة — TBD) |
| الصوت الأصلي | حوار (مزامنة الشفاه)، SFX، صوت خلفية محيطة في تمريرة واحدة (استناداً إلى تسريبات — TBD) |
| الدقة | TBD — يخضع للإصدار الرسمي |
| المدة / FPS / الأسعار | TBD — يخضع للإصدار الرسمي |
لماذا يتميز Gemini Omni
بنية نموذج omni الموحد
يبدو أن Gemini Omni أول نموذج فيديو من Google مبني على بنية omni موحدة — نموذج واحد يتعامل مع النص والصورة والفيديو والصوت في تمريرة واحدة، مما يُزيل الفجوات بين الأنماط التي تُحدثها نماذج الخطوط المنفصلة. تفاصيل البنية ستُؤكد رسمياً.
تحرير الفيديو عبر الدردشة
استناداً إلى عروض توضيحية مسربة، يمكنك وصف التغييرات بلغة عادية ويطبقها Gemini Omni مباشرةً — أزِل علامة مائية، استبدل كائناً، أعِد كتابة مشهد. لا حاجة لتمرير الجدول الزمني أو التحرير إطاراً بإطار. تفاصيل الميزة تخضع للإصدار الرسمي.
صوت متزامن أصلي في تمريرة واحدة
تُظهر العروض المسربة حواراً بمزامنة الشفاه وتأثيرات صوتية على الشاشة وصوت خلفية محيطة مُنتجة مع الفيديو في تمريرة واحدة للأمام — دون مرحلة TTS أو Foley منفصلة. المواصفات المؤكدة ستُعلن رسمياً.
Gemini Omni مقابل منشئات الفيديو الأخرى بالذكاء الاصطناعي
| Feature | Gemini Omni | Veo 3.1 | Sora 2 | Grok Imagine |
|---|---|---|---|---|
| المزود | Google DeepMind | Google DeepMind | OpenAI | xAI |
| البنية | نموذج omni موحد (TBD) | الانتشار | الانتشار | Aurora (تراجعي ذاتي) |
| التحرير عبر الدردشة | نعم (وفق تسريبات) | لا | لا | لا |
| أقصى دقة | TBD | 1080p | 1080p | 720p |
| الصوت الأصلي | نعم (وفق تسريبات) | نعم | نعم | نعم |
| إدخال الصور | TBD | حتى 3 صور | صورة واحدة + Cameos | صورة واحدة |
| القوالب | نعم (وفق واجهة مستخدم مسربة) | لا | لا | لا |
| التوافر | قريباً | متاح | متاح | متاح |
الاستخدامات المتوقعة للمبدعين والمحررين وراوي القصص
تحرير الفيديو عبر الدردشة
استناداً إلى عروض توضيحية مسربة، يمكنك تخطي محرر الجدول الزمني ووصف التغيير المطلوب — أزِل عنصراً، استبدل كائناً، غيّر المشهد — ويطبقه Gemini Omni مباشرةً عبر اللغة الطبيعية.
محتوى اجتماعي قائم على القوالب
استناداً إلى واجهة المستخدم المسربة، يمكنك اختيار قالب جاهز وإدراج موجهك والحصول على فيديو مُكوَّن بالكامل مع صوت — دون خبرة إنتاجية. تفاصيل القوالب الكاملة تخضع للإصدار الرسمي.
إنشاء مشاهد الحوار
أنشئ مشاهد محادثة واقعية بمزامنة شفاه دقيقة وصوت محيطة في تمريرة واحدة — مثالي للنصوص التسويقية والمحتوى التعليمي وحوار الأفلام القصيرة.
تحريك الصور مع الصوت
ارفع صورة أو رسماً وحرّكه بموجه. يُضيف Gemini Omni الحركة وتأثيرات الصوت المتزامنة دون أداة صوت منفصلة.
تصوير مشاهد القصة المصورة
استعرض بسرعة نبضات السيناريو كمقاطع قصيرة بصوت أصلي. استخدم محرر الدردشة لتعديل التأطير أو الحوار بين اللقطات دون إعادة الإنشاء من الصفر.
إنتاج فيديو العلامة التجارية
استخدم القوالب لإنتاج فيديو العلامة التجارية بسرعة، ثم حسّنه بالتحرير عبر الدردشة — استبدل العناصر أو اضبط النبرة لتتوافق مع صوت علامتك التجارية.
استكشف منشئات الفيديو المرتبطة بالذكاء الاصطناعي

Veo 3.1
نموذج الفيديو 1080p من Google DeepMind مع إنشاء إطارات إلى فيديو وصوت أصلي.

Sora 2
منشئ الفيديو السينمائي من OpenAI بحركة دقيقة فيزيائياً ومدة 20 ثانية.

Grok Imagine
نموذج فيديو محرك Aurora من xAI بأوضاع Fun/Normal/Spicy وصوت أصلي.
Happy Horse 1.0
منشئ الفيديو بالذكاء الاصطناعي الأول بالحركة السينمائية ومزامنة الشفاه بـ 7 لغات.

Seedance 2.0
نموذج فيديو ByteDance مع تكامل البحث على الويب وصوت متزامن.
Kling 3.0
فيديو 4K بجودة المخرجين مع تصوير سينمائي AI متعدد اللقطات وصوت أصلي.
الأسئلة الشائعة حول Gemini Omni
ما هو Gemini Omni؟
Gemini Omni هو نموذج توليد الفيديو القادم من Google DeepMind، شوهد لأول مرة كسلسلة في واجهة مستخدم تطبيق Gemini قبيل Google I/O 2026. يبدو أنه نموذج omni موحد يتعامل مع النص والصورة والفيديو والصوت في نظام واحد، مع صوت متزامن أصلي وتحرير فيديو عبر الدردشة. جميع التفاصيل تخضع للإعلان الرسمي.
كيف يختلف Gemini Omni عن Veo 3.1؟
Veo 3.1 نموذج انتشار فيديو متخصص بمواصفات موثقة ومعروفة. يبدو أن Gemini Omni مبني على بنية omni موحدة — نموذج واحد يتعامل مع النص والصورة والفيديو والصوت في تمريرة واحدة، مماثلاً لـ GPT-4o. يتيح ذلك التحرير عبر الدردشة والإنشاء القائم على القوالب الذي لا يوفره Veo 3.1. تفاصيل البنية الدقيقة ستُؤكد رسمياً.
ما هو التحرير القائم على الدردشة في Gemini Omni؟
استناداً إلى عروض توضيحية مسربة، يتيح Gemini Omni وصف التعديلات بلغة عادية — مثلاً: 'أزِل العلامة المائية'، 'استبدل الكوب الأحمر بكوب قهوة'، أو 'أعِد كتابة هذا المشهد ليكون الشخصية في الخارج'. يطبق النموذج التعديل دون عمل يدوي إطاراً بإطار. هذه الميزة لم تُؤكد رسمياً والتفاصيل قد تتغير.
هل ينشئ Gemini Omni صوتاً متزامناً؟
استناداً إلى عروض توضيحية مسربة، يبدو أن Gemini Omni ينشئ صوتاً متزامناً أصلياً — بما فيه حوار بمزامنة الشفاه وتأثيرات صوتية مزامنة مع الإجراءات على الشاشة وصوت خلفية محيطة — في تمريرة واحدة للأمام. لم يُؤكد ذلك رسمياً والمواصفات الكاملة ستُعلن في Google I/O 2026.
متى سيكون Gemini Omni متاحاً على LoveGen AI؟
شوهد Gemini Omni في واجهة مستخدم مسربة قبيل Google I/O 2026 (19-20 مايو 2026). لم تُعلن Google رسمياً عن الأسعار أو API أو تاريخ التوافر بعد. ستدمج LoveGen AI النموذج فور إتاحة API للعموم.
ما القوالب التي يتضمنها Gemini Omni؟
كانت مكتبة القوالب الجاهزة مرئية في واجهة المستخدم المسربة لتطبيق Gemini. تبدو القوالب تتعامل تلقائياً مع التكوين والإيقاع والصوت لإنشاء الفيديو بسرعة. التفاصيل الكاملة — بما فيها عدد القوالب والفئات — ستُؤكد عند الإعلان الرسمي.
