
Google DeepMind
Gemini Omni
API العام ينتشر في الأسابيع التالية لـ Google I/O 2026
أُطلق Gemini Omni Flash في 19 مايو 2026. ستضيفه LoveGen AI فور طرح API Vertex AI العام.
منشئ الفيديو بالذكاء الاصطناعي Gemini Omni Flash
أنشئ وحرّر مقاطع فيديو بالذكاء الاصطناعي مع نموذج omni الموحد من Google
Gemini Omni Flash هو نموذج توليد الفيديو الموحد الجديد من Google DeepMind، أُعلن عنه وأُطلق في Google I/O 2026 بتاريخ 19 مايو 2026. على خلاف نماذج Veo المتخصصة، يُبنى Gemini Omni Flash على بنية omni موحدة قائمة على المحوّلات، تقبل بشكل أصلي مدخلات النص والصورة والصوت والفيديو وتُنتج فيديو عالي الدقة بصوت متزامن في تمريرة واحدة. يدعم التحرير التفاعلي متعدد الجولات — غيّر زاوية الكاميرا، بدّل الكائنات، أعِد كتابة المشاهد، أو عدّل الخلفيات باستخدام موجهات باللغة الطبيعية.
كُشف عن Gemini Omni في Google I/O 2026، مع طرح النموذج الأول — Gemini Omni Flash — في اليوم نفسه (19 مايو 2026). تصفه Google بأنه نموذج قادر على إنشاء أي شيء من أي مدخل، بدءاً بالفيديو، ويجمع بين قدرات Gemini الاستدلالية والوسائط التوليدية لتحقيق فهم أعمق للعالم، وتعددية الوسائط، والتحرير.
عند الإطلاق، ينتج Gemini Omni Flash مقاطع بدقة عالية مدتها 10 ثوانٍ مقرونة بصوت متزامن أصلي — حوار بمزامنة الشفاه، وتأثيرات صوتية متزامنة مع الإجراءات على الشاشة، وصوت خلفية محيطة — كل ذلك يُولَّد في تمريرة أمامية واحدة. أكدت Google أن حد الـ 10 ثوانٍ قرار نشر وليس قيداً على النموذج. يُتيح التحسين في فهم الفيزياء، بما فيها الجاذبية والطاقة الحركية وديناميكيات السوائل، حركة أكثر واقعية.
الميزة الرئيسية عند الشحن هي التحرير التفاعلي متعدد الجولات. بمجرد حصولك على مقطع، تصف التغييرات بلغة طبيعية — "حوّل زاوية الكاميرا إلى اليسار"، "اجعل التمثال من فقاعات"، "عندما يلمس الشخص المرآة، اجعلها تتموج كالسائل" — ويُعيد Omni صياغة العنصر المستهدف مع إبقاء الباقي سليماً. يتيح تكديس المراجع الجمع بين صورة شخصية وملف صوتي ومرجع أسلوبي في موجه واحد، والإنشاء القائم على القوالب بنقرة واحدة مدمج في تطبيق Gemini وGoogle Flow.
ينتشر Gemini Omni Flash عالمياً لمشتركي Google AI Plus وPro وUltra عبر تطبيق Gemini وGoogle Flow، وبدون تكلفة للمستخدمين فوق 18 عاماً في YouTube Shorts Remix وتطبيق YouTube Create. كل فيديو مُولَّد يحمل علامة مائية SynthID غير مرئية وبيانات اعتماد محتوى C2PA. وصول المطورين والمؤسسات عبر Vertex AI ينتشر في الأسابيع التالية لـ I/O؛ ستدمج LoveGen AI نموذج Gemini Omni Flash فور إتاحة API للعموم.
كيفية استخدام Gemini Omni Flash
الخطوة 1: اختر وضع الإنشاء
أنشئ من موجه نصي، أو حرّك صورة، أو امزج مراجع متعددة (صورة وصوت وأسلوب)، أو اختر قالباً مدمجاً للإنشاء بنقرة واحدة.
الخطوة 2: صِف فيديوك أو تعديلك
اكتب موجهاً تفصيلياً أو صِف تعديلاً بلغة طبيعية — يفهم Gemini Omni Flash حركات الكاميرا واستبدال الكائنات وتغييرات الخلفية وتحولات الأسلوب عبر الدردشة.
الخطوة 3: أنشئ وحسّن
انقر على إنشاء. يُعيد Gemini Omni Flash مقطعاً بدقة عالية مدته 10 ثوانٍ مع صوت متزامن أصلي. استخدم الدردشة متعددة الجولات لتحسين عناصر محددة دون البدء من جديد.
المواصفات التقنية لـ Gemini Omni Flash
| المزود | Google DeepMind |
| تاريخ الإصدار | 19 مايو 2026 (Google I/O 2026) |
| النسخة | Gemini Omni Flash (أول نموذج شحن في عائلة Omni) |
| البنية | نموذج omni موحد قائم على المحوّلات (نص + صورة + صوت + فيديو مدخلات → فيديو + صوت مخرجات) |
| أوضاع الإدخال | نص، صورة، صوت، فيديو — بما فيها تكديس المراجع المتعددة |
| المخرجات | فيديو عالي الدقة بصوت متزامن أصلي |
| أقصى مدة | 10 ثوانٍ للمقطع (حد نشر وليس قيد النموذج) |
| الصوت الأصلي | حوار (مزامنة الشفاه)، SFX، صوت محيط — مُولَّد في تمريرة واحدة |
| التحرير | تفاعلي متعدد الجولات — الكاميرا، الخلفيات، الكائنات، الإجراءات، الأسلوب |
| الفيزياء | تحسين في الجاذبية والطاقة الحركية وديناميكيات السوائل |
| الإثبات | علامة مائية SynthID + بيانات اعتماد محتوى C2PA (إلزامي) |
| التوافر | تطبيق Gemini وGoogle Flow (AI Plus/Pro/Ultra)؛ YouTube Shorts Remix وتطبيق Create (مجاني، +18) |
| وصول API | API عام عبر Vertex AI ينتشر في الأسابيع التالية لـ I/O 2026 |
لماذا يتميز Gemini Omni Flash
بنية نموذج omni الموحد
Gemini Omni Flash هو أول نموذج فيديو شحن من Google مبني على بنية omni موحدة قائمة على المحوّلات — نموذج واحد يتعامل مع النص والصورة والصوت والفيديو في تمريرة واحدة، مما يُزيل الفجوات بين الأنماط التي تُحدثها أنظمة الخطوط المنفصلة. يتيح تكديس المراجع الجمع بين صورة شخصية وملف صوتي ومرجع أسلوبي في موجه واحد.
التحرير التفاعلي متعدد الجولات
صِف التغييرات بلغة طبيعية ويُطبقها Gemini Omni Flash مباشرةً — غيّر الكاميرا، بدّل كائناً، أعِد كتابة مشهد، أو غيّر خلفية — مع إبقاء باقي المقطع سليماً. التعديلات متعددة الجولات تبني على السياق السابق حتى تتمكن من التكرار دون البدء من جديد.
صوت متزامن أصلي + فيزياء محسّنة
يُنتج حوار بمزامنة الشفاه وتأثيرات صوتية على الشاشة وصوت خلفية محيطة مع الفيديو في تمريرة أمامية واحدة — دون مرحلة TTS أو Foley منفصلة. يُوفر التحسين في فهم الجاذبية والطاقة الحركية وديناميكيات السوائل حركة أكثر واقعية، وكل مخرج يحمل إثبات SynthID وC2PA.
Gemini Omni Flash مقابل منشئات الفيديو الأخرى بالذكاء الاصطناعي
| Feature | Gemini Omni Flash | Veo 3.1 | Sora 2 | Grok Imagine |
|---|---|---|---|---|
| المزود | Google DeepMind | Google DeepMind | OpenAI | xAI |
| البنية | نموذج omni موحد قائم على المحوّلات | الانتشار | الانتشار | Aurora (تراجعي ذاتي) |
| التحرير التفاعلي | نعم — متعدد الجولات | لا | لا | لا |
| أقصى دقة | عالية الدقة | 1080p | 1080p | 720p |
| أقصى مدة | 10 ثوانٍ (حد نشر) | 8 ثوانٍ (قابلة للتمديد) | 20 ثانية | 15 ثانية |
| الصوت الأصلي | نعم — تمريرة واحدة | نعم | نعم | نعم |
| أوضاع الإدخال | نص، صورة، صوت، فيديو | نص، صورة (حتى 3) | نص، صورة + Cameos | نص، صورة واحدة |
| القوالب | نعم | لا | لا | لا |
| الإثبات | SynthID + C2PA | SynthID | C2PA | — |
| التوافر | تطبيق Gemini، Flow، YouTube | متاح | متاح | متاح |
ما يمكنك بناؤه مع Gemini Omni Flash
تحرير الفيديو التفاعلي
تخطَّ محرر الجدول الزمني كلياً — صِف التغيير المطلوب بلغة طبيعية ويُطبقه Gemini Omni Flash مباشرةً. غيّر زوايا الكاميرا، بدّل الكائنات، غيّر الخلفيات، أو أعِد كتابة إجراء كامل بموجه واحد.
محتوى اجتماعي قائم على القوالب
اختر قالباً مدمجاً، أضِف موجهك، واحصل على مقطع مُكوَّن بالكامل مدته 10 ثوانٍ مع صوت متزامن — مصمم لتنسيقات YouTube Shorts وReels وTikTok دون خبرة إنتاجية.
إنشاء مشاهد الحوار
أنشئ مشاهد محادثة واقعية بمزامنة شفاه دقيقة وصوت محيطة في تمريرة واحدة — مثالي للنصوص التسويقية والمحتوى التعليمي وحوار الأفلام القصيرة.
الإنشاء بتكديس المراجع
اجمع صورة شخصية وملف صوتي ومرجع أسلوبي في موجه واحد لتوليد شخصيات متسقة تتطابق مع مظهر وصوت وجماليات محددة عبر المقاطع.
لوحة قصص المشاهد
استعرض بسرعة نبضات السيناريو كمقاطع قصيرة بصوت أصلي. استخدم تحرير الدردشة متعدد الجولات لضبط التأطير واستبدال الكائنات أو إعادة كتابة الإجراءات عبر اللقطات دون إعادة الإنشاء من الصفر.
إنتاج فيديو العلامة التجارية
استخدم القوالب لإنتاج فيديو العلامة التجارية بسرعة، ثم حسّنه بالتحرير التفاعلي — بدّل لقطات المنتج، غيّر الخلفيات، أو اضبط النبرة البصرية لتتوافق مع علامتك التجارية.
استكشف منشئات الفيديو المرتبطة بالذكاء الاصطناعي

Veo 3.1
نموذج الفيديو 1080p من Google DeepMind مع إنشاء إطارات إلى فيديو وصوت أصلي.

Sora 2
منشئ الفيديو السينمائي من OpenAI بحركة دقيقة فيزيائياً ومدة 20 ثانية.

Grok Imagine
نموذج فيديو محرك Aurora من xAI بأوضاع Fun/Normal/Spicy وصوت أصلي.
Happy Horse 1.0
منشئ الفيديو بالذكاء الاصطناعي الأول بالحركة السينمائية ومزامنة الشفاه بـ 7 لغات.

Seedance 2.0
نموذج فيديو ByteDance مع تكامل البحث على الويب وصوت متزامن.
Kling 3.0
فيديو 4K بجودة المخرجين مع تصوير سينمائي AI متعدد اللقطات وصوت أصلي.
الأسئلة الشائعة حول Gemini Omni Flash
ما هو Gemini Omni Flash؟
Gemini Omni Flash هو نموذج توليد الفيديو الموحد الجديد من Google DeepMind، أُعلن عنه وأُطلق في Google I/O 2026 بتاريخ 19 مايو 2026. وهو أول نموذج شحن في عائلة Gemini Omni — مبني على بنية omni موحدة قائمة على المحوّلات تتعامل بشكل أصلي مع مدخلات النص والصورة والصوت والفيديو وتُنتج فيديو عالي الدقة بصوت متزامن في تمريرة واحدة. تشمل الميزات الرئيسية التحرير التفاعلي متعدد الجولات وتحسين فهم الفيزياء وتكديس المراجع.
كيف يختلف Gemini Omni Flash عن Veo 3.1؟
Veo 3.1 نموذج انتشار فيديو متخصص يركز بالكامل على تحويل النص والصورة إلى فيديو. Gemini Omni Flash مبني على بنية omni موحدة قائمة على المحوّلات — نموذج واحد يتعامل مع النص والصورة والصوت والفيديو في تمريرة واحدة، مشابه من حيث المفهوم لـ GPT-4o — ويربط توليد الفيديو بقدرات Gemini الاستدلالية. يُتيح ذلك التحرير التفاعلي متعدد الجولات وتكديس المراجع والإنشاء القائم على القوالب الذي لا يوفره Veo 3.1. يوفر Veo 3.1 حالياً مقاطع أطول وتحكماً أغنى في مدخلات متعددة الصور.
ما هو التحرير التفاعلي في Gemini Omni Flash؟
بمجرد حصولك على مقطع، تصف التغييرات بلغة طبيعية — 'حوّل زاوية الكاميرا إلى اليسار'، 'اجعل التمثال من فقاعات'، 'استبدل الكوب الأحمر بكوب قهوة'، أو 'أعِد كتابة هذا المشهد ليكون الشخصية في الخارج' — ويُعيد Gemini Omni Flash صياغة العنصر المستهدف مع إبقاء الباقي سليماً. التعديلات متعددة الجولات تبني على السياق السابق حتى تتمكن من التكرار دون إعادة البدء. تحرير الصوت على الفيديوهات الموجودة محجوب عمداً عند الإطلاق.
هل ينشئ Gemini Omni Flash صوتاً متزامناً؟
نعم. ينتج Gemini Omni Flash صوتاً متزامناً أصلياً — حوار بمزامنة الشفاه وتأثيرات صوتية متزامنة مع الإجراءات على الشاشة وصوت خلفية محيطة — في تمريرة أمامية واحدة جنباً إلى جنب مع الفيديو، دون مرحلة TTS أو Foley منفصلة. كل المخرجات المُولَّدة تُوسَم تلقائياً بعلامة مائية SynthID وبيانات اعتماد محتوى C2PA.
متى سيكون Gemini Omni Flash متاحاً على LoveGen AI؟
أُطلق Gemini Omni Flash في 19 مايو 2026 داخل تطبيق Gemini وGoogle Flow وYouTube Shorts Remix وتطبيق YouTube Create. وصول المطورين والمؤسسات العام عبر Vertex AI ينتشر في الأسابيع التالية لـ Google I/O 2026. ستدمج LoveGen AI نموذج Gemini Omni Flash فور إتاحة API للعموم.
ما قوالب الفيديو التي يتضمنها Gemini Omni Flash؟
يُشحن Gemini Omni Flash مع إنشاء فيديو قائم على القوالب، مُطبَّق بنقرة واحدة داخل تطبيق Gemini وGoogle Flow. تتعامل القوالب مع التكوين والإيقاع والصوت للإنشاء السريع، وتتوفر أيضاً إمكانية إنشاء صورة رمزية مخصصة بالذكاء الاصطناعي. كتالوج القوالب الحالي موجود داخل تطبيق Gemini وواجهات منتج Flow.
