Google DeepMind

Google DeepMind

Gemini Omni

Coming Soon

لم تُصدره Google رسمياً بعد

Google's unified omni-model for video generation is launching soon on LoveGen AI.

منشئ الفيديو بالذكاء الاصطناعي Gemini Omni

أنشئ وحرّر مقاطع فيديو بالذكاء الاصطناعي مع نموذج omni الموحد من Google

Gemini Omni هو نموذج توليد الفيديو الموحد القادم من Google DeepMind، شوهد لأول مرة كسلسلة في واجهة مستخدم تطبيق Gemini قبيل Google I/O 2026. على خلاف نماذج Veo المتخصصة، يبدو أن Gemini Omni مبني على بنية omni موحدة تتعامل مع النص والصورة والفيديو والصوت في نظام واحد. استناداً إلى عروض توضيحية مسربة، يدعم الصوت المتزامن الأصلي وتحرير الفيديو عبر الدردشة — المواصفات الدقيقة تخضع للإعلان الرسمي.

اكتُشف Gemini Omni كسلسلة في واجهة مستخدم تطبيق Gemini في مايو 2026، قبل أيام قليلة من Google I/O 2026 (المقرر في 19-20 مايو). لم تُعلن Google رسمياً عن النموذج، وجميع المعلومات أدناه مستندة إلى عروض وسلاسل واجهة مستخدم مسربة وليس وثائق رسمية. المواصفات والأسعار والتوافر تخضع للإصدار الرسمي.

من التسريبات المتاحة، يبدو أن النموذج يدعم تحرير الفيديو عبر الدردشة كميزة أساسية. يبدو أن المستخدمين يستطيعون وصف التغييرات بلغة طبيعية — على سبيل المثال إزالة علامة مائية، أو استبدال كائن بآخر، أو إعادة كتابة مشهد بأكمله — ويطبق النموذج التعديل دون عمل يدوي إطاراً بإطار. تضمنت المواد التوضيحية المسربة مشهداً لرجلين يتناولان السباغيتي في مطعم فاخر وأستاذ يكتب براهين رياضية على السبورة أثناء السرد.

يبدو أن الصوت المتزامن الأصلي يُنتج في تمريرة واحدة: حوار بمزامنة الشفاه وتأثيرات صوتية على الشاشة وصوت خلفية محيطة — كل ذلك معاً دون مرحلة معالجة TTS أو Foley منفصلة. كانت مكتبة قوالب جاهزة للبدء السريع مرئية أيضاً في واجهة المستخدم المسربة للتطبيق.

جميع المواصفات التقنية — بما فيها الدقة والمدة ومعدل الإطارات ونسب العرض إلى الارتفاع والأسعار — لم تُؤكد رسمياً وستُعلن لاحقاً. ستدمج LoveGen AI نموذج Gemini Omni فور إتاحة API للعموم.

كيفية استخدام Gemini Omni

01

الخطوة 1: اختر وضع الإنشاء

اختر نصاً إلى فيديو للإنشاء من موجه، أو صورة إلى فيديو لتحريك صورة مرجعية، أو اختر قالباً جاهزاً للبدء السريع.

02

الخطوة 2: صِف فيديوك أو تعديلك

اكتب موجهاً تفصيلياً أو صِف تعديلاً بلغة عادية — يفهم Gemini Omni تغييرات المشاهد باللغة الطبيعية واستبدال الكائنات وتعديلات الأسلوب عبر الدردشة.

03

الخطوة 3: أنشئ وحسّن

انقر على إنشاء. سيُعيد Gemini Omni فيديو مع صوت متزامن أصلي. استخدم محرر الدردشة لتحسين عناصر محددة دون البدء من جديد.

المواصفات التقنية لـ Gemini Omni

المزودGoogle DeepMind
البنيةنموذج omni موحد (نص + صورة + فيديو + صوت) — يخضع للتأكيد الرسمي
الحالة الحاليةلم يُعلن رسمياً بعد — شوهد في واجهة مستخدم مسربة، مايو 2026
الإعلان المتوقعGoogle I/O 2026 (19-20 مايو 2026)
أوضاع الإدخالنص إلى فيديو، صورة إلى فيديو، تحرير قائم على الدردشة (استناداً إلى تسريبات — TBD)
تحرير الفيديوعبر الدردشة: استبدال الكائنات، إزالة العلامات المائية، إعادة كتابة المشاهد (استناداً إلى تسريبات — TBD)
القوالبمكتبة قوالب جاهزة (استناداً إلى واجهة مستخدم مسربة — TBD)
الصوت الأصليحوار (مزامنة الشفاه)، SFX، صوت خلفية محيطة في تمريرة واحدة (استناداً إلى تسريبات — TBD)
الدقةTBD — يخضع للإصدار الرسمي
المدة / FPS / الأسعارTBD — يخضع للإصدار الرسمي

لماذا يتميز Gemini Omni

بنية نموذج omni الموحد

يبدو أن Gemini Omni أول نموذج فيديو من Google مبني على بنية omni موحدة — نموذج واحد يتعامل مع النص والصورة والفيديو والصوت في تمريرة واحدة، مما يُزيل الفجوات بين الأنماط التي تُحدثها نماذج الخطوط المنفصلة. تفاصيل البنية ستُؤكد رسمياً.

تحرير الفيديو عبر الدردشة

استناداً إلى عروض توضيحية مسربة، يمكنك وصف التغييرات بلغة عادية ويطبقها Gemini Omni مباشرةً — أزِل علامة مائية، استبدل كائناً، أعِد كتابة مشهد. لا حاجة لتمرير الجدول الزمني أو التحرير إطاراً بإطار. تفاصيل الميزة تخضع للإصدار الرسمي.

صوت متزامن أصلي في تمريرة واحدة

تُظهر العروض المسربة حواراً بمزامنة الشفاه وتأثيرات صوتية على الشاشة وصوت خلفية محيطة مُنتجة مع الفيديو في تمريرة واحدة للأمام — دون مرحلة TTS أو Foley منفصلة. المواصفات المؤكدة ستُعلن رسمياً.

Gemini Omni مقابل منشئات الفيديو الأخرى بالذكاء الاصطناعي

FeatureGemini OmniVeo 3.1Sora 2Grok Imagine
المزودGoogle DeepMindGoogle DeepMindOpenAIxAI
البنيةنموذج omni موحد (TBD)الانتشارالانتشارAurora (تراجعي ذاتي)
التحرير عبر الدردشةنعم (وفق تسريبات)لالالا
أقصى دقةTBD1080p1080p720p
الصوت الأصلينعم (وفق تسريبات)نعمنعمنعم
إدخال الصورTBDحتى 3 صورصورة واحدة + Cameosصورة واحدة
القوالبنعم (وفق واجهة مستخدم مسربة)لالالا
التوافرقريباًمتاحمتاحمتاح

الاستخدامات المتوقعة للمبدعين والمحررين وراوي القصص

01

تحرير الفيديو عبر الدردشة

استناداً إلى عروض توضيحية مسربة، يمكنك تخطي محرر الجدول الزمني ووصف التغيير المطلوب — أزِل عنصراً، استبدل كائناً، غيّر المشهد — ويطبقه Gemini Omni مباشرةً عبر اللغة الطبيعية.

02

محتوى اجتماعي قائم على القوالب

استناداً إلى واجهة المستخدم المسربة، يمكنك اختيار قالب جاهز وإدراج موجهك والحصول على فيديو مُكوَّن بالكامل مع صوت — دون خبرة إنتاجية. تفاصيل القوالب الكاملة تخضع للإصدار الرسمي.

03

إنشاء مشاهد الحوار

أنشئ مشاهد محادثة واقعية بمزامنة شفاه دقيقة وصوت محيطة في تمريرة واحدة — مثالي للنصوص التسويقية والمحتوى التعليمي وحوار الأفلام القصيرة.

04

تحريك الصور مع الصوت

ارفع صورة أو رسماً وحرّكه بموجه. يُضيف Gemini Omni الحركة وتأثيرات الصوت المتزامنة دون أداة صوت منفصلة.

05

تصوير مشاهد القصة المصورة

استعرض بسرعة نبضات السيناريو كمقاطع قصيرة بصوت أصلي. استخدم محرر الدردشة لتعديل التأطير أو الحوار بين اللقطات دون إعادة الإنشاء من الصفر.

06

إنتاج فيديو العلامة التجارية

استخدم القوالب لإنتاج فيديو العلامة التجارية بسرعة، ثم حسّنه بالتحرير عبر الدردشة — استبدل العناصر أو اضبط النبرة لتتوافق مع صوت علامتك التجارية.

استكشف منشئات الفيديو المرتبطة بالذكاء الاصطناعي

الأسئلة الشائعة حول Gemini Omni

ما هو Gemini Omni؟

Gemini Omni هو نموذج توليد الفيديو القادم من Google DeepMind، شوهد لأول مرة كسلسلة في واجهة مستخدم تطبيق Gemini قبيل Google I/O 2026. يبدو أنه نموذج omni موحد يتعامل مع النص والصورة والفيديو والصوت في نظام واحد، مع صوت متزامن أصلي وتحرير فيديو عبر الدردشة. جميع التفاصيل تخضع للإعلان الرسمي.

كيف يختلف Gemini Omni عن Veo 3.1؟

Veo 3.1 نموذج انتشار فيديو متخصص بمواصفات موثقة ومعروفة. يبدو أن Gemini Omni مبني على بنية omni موحدة — نموذج واحد يتعامل مع النص والصورة والفيديو والصوت في تمريرة واحدة، مماثلاً لـ GPT-4o. يتيح ذلك التحرير عبر الدردشة والإنشاء القائم على القوالب الذي لا يوفره Veo 3.1. تفاصيل البنية الدقيقة ستُؤكد رسمياً.

ما هو التحرير القائم على الدردشة في Gemini Omni؟

استناداً إلى عروض توضيحية مسربة، يتيح Gemini Omni وصف التعديلات بلغة عادية — مثلاً: 'أزِل العلامة المائية'، 'استبدل الكوب الأحمر بكوب قهوة'، أو 'أعِد كتابة هذا المشهد ليكون الشخصية في الخارج'. يطبق النموذج التعديل دون عمل يدوي إطاراً بإطار. هذه الميزة لم تُؤكد رسمياً والتفاصيل قد تتغير.

هل ينشئ Gemini Omni صوتاً متزامناً؟

استناداً إلى عروض توضيحية مسربة، يبدو أن Gemini Omni ينشئ صوتاً متزامناً أصلياً — بما فيه حوار بمزامنة الشفاه وتأثيرات صوتية مزامنة مع الإجراءات على الشاشة وصوت خلفية محيطة — في تمريرة واحدة للأمام. لم يُؤكد ذلك رسمياً والمواصفات الكاملة ستُعلن في Google I/O 2026.

متى سيكون Gemini Omni متاحاً على LoveGen AI؟

شوهد Gemini Omni في واجهة مستخدم مسربة قبيل Google I/O 2026 (19-20 مايو 2026). لم تُعلن Google رسمياً عن الأسعار أو API أو تاريخ التوافر بعد. ستدمج LoveGen AI النموذج فور إتاحة API للعموم.

ما القوالب التي يتضمنها Gemini Omni؟

كانت مكتبة القوالب الجاهزة مرئية في واجهة المستخدم المسربة لتطبيق Gemini. تبدو القوالب تتعامل تلقائياً مع التكوين والإيقاع والصوت لإنشاء الفيديو بسرعة. التفاصيل الكاملة — بما فيها عدد القوالب والفئات — ستُؤكد عند الإعلان الرسمي.