Google DeepMind

Google DeepMind

Gemini Omni

قريباً

API العام ينتشر في الأسابيع التالية لـ Google I/O 2026

أُطلق Gemini Omni Flash في 19 مايو 2026. ستضيفه LoveGen AI فور طرح API Vertex AI العام.

منشئ الفيديو بالذكاء الاصطناعي Gemini Omni Flash

أنشئ وحرّر مقاطع فيديو بالذكاء الاصطناعي مع نموذج omni الموحد من Google

Gemini Omni Flash هو نموذج توليد الفيديو الموحد الجديد من Google DeepMind، أُعلن عنه وأُطلق في Google I/O 2026 بتاريخ 19 مايو 2026. على خلاف نماذج Veo المتخصصة، يُبنى Gemini Omni Flash على بنية omni موحدة قائمة على المحوّلات، تقبل بشكل أصلي مدخلات النص والصورة والصوت والفيديو وتُنتج فيديو عالي الدقة بصوت متزامن في تمريرة واحدة. يدعم التحرير التفاعلي متعدد الجولات — غيّر زاوية الكاميرا، بدّل الكائنات، أعِد كتابة المشاهد، أو عدّل الخلفيات باستخدام موجهات باللغة الطبيعية.

كُشف عن Gemini Omni في Google I/O 2026، مع طرح النموذج الأول — Gemini Omni Flash — في اليوم نفسه (19 مايو 2026). تصفه Google بأنه نموذج قادر على إنشاء أي شيء من أي مدخل، بدءاً بالفيديو، ويجمع بين قدرات Gemini الاستدلالية والوسائط التوليدية لتحقيق فهم أعمق للعالم، وتعددية الوسائط، والتحرير.

عند الإطلاق، ينتج Gemini Omni Flash مقاطع بدقة عالية مدتها 10 ثوانٍ مقرونة بصوت متزامن أصلي — حوار بمزامنة الشفاه، وتأثيرات صوتية متزامنة مع الإجراءات على الشاشة، وصوت خلفية محيطة — كل ذلك يُولَّد في تمريرة أمامية واحدة. أكدت Google أن حد الـ 10 ثوانٍ قرار نشر وليس قيداً على النموذج. يُتيح التحسين في فهم الفيزياء، بما فيها الجاذبية والطاقة الحركية وديناميكيات السوائل، حركة أكثر واقعية.

الميزة الرئيسية عند الشحن هي التحرير التفاعلي متعدد الجولات. بمجرد حصولك على مقطع، تصف التغييرات بلغة طبيعية — "حوّل زاوية الكاميرا إلى اليسار"، "اجعل التمثال من فقاعات"، "عندما يلمس الشخص المرآة، اجعلها تتموج كالسائل" — ويُعيد Omni صياغة العنصر المستهدف مع إبقاء الباقي سليماً. يتيح تكديس المراجع الجمع بين صورة شخصية وملف صوتي ومرجع أسلوبي في موجه واحد، والإنشاء القائم على القوالب بنقرة واحدة مدمج في تطبيق Gemini وGoogle Flow.

ينتشر Gemini Omni Flash عالمياً لمشتركي Google AI Plus وPro وUltra عبر تطبيق Gemini وGoogle Flow، وبدون تكلفة للمستخدمين فوق 18 عاماً في YouTube Shorts Remix وتطبيق YouTube Create. كل فيديو مُولَّد يحمل علامة مائية SynthID غير مرئية وبيانات اعتماد محتوى C2PA. وصول المطورين والمؤسسات عبر Vertex AI ينتشر في الأسابيع التالية لـ I/O؛ ستدمج LoveGen AI نموذج Gemini Omni Flash فور إتاحة API للعموم.

كيفية استخدام Gemini Omni Flash

01

الخطوة 1: اختر وضع الإنشاء

أنشئ من موجه نصي، أو حرّك صورة، أو امزج مراجع متعددة (صورة وصوت وأسلوب)، أو اختر قالباً مدمجاً للإنشاء بنقرة واحدة.

02

الخطوة 2: صِف فيديوك أو تعديلك

اكتب موجهاً تفصيلياً أو صِف تعديلاً بلغة طبيعية — يفهم Gemini Omni Flash حركات الكاميرا واستبدال الكائنات وتغييرات الخلفية وتحولات الأسلوب عبر الدردشة.

03

الخطوة 3: أنشئ وحسّن

انقر على إنشاء. يُعيد Gemini Omni Flash مقطعاً بدقة عالية مدته 10 ثوانٍ مع صوت متزامن أصلي. استخدم الدردشة متعددة الجولات لتحسين عناصر محددة دون البدء من جديد.

المواصفات التقنية لـ Gemini Omni Flash

المزودGoogle DeepMind
تاريخ الإصدار19 مايو 2026 (Google I/O 2026)
النسخةGemini Omni Flash (أول نموذج شحن في عائلة Omni)
البنيةنموذج omni موحد قائم على المحوّلات (نص + صورة + صوت + فيديو مدخلات → فيديو + صوت مخرجات)
أوضاع الإدخالنص، صورة، صوت، فيديو — بما فيها تكديس المراجع المتعددة
المخرجاتفيديو عالي الدقة بصوت متزامن أصلي
أقصى مدة10 ثوانٍ للمقطع (حد نشر وليس قيد النموذج)
الصوت الأصليحوار (مزامنة الشفاه)، SFX، صوت محيط — مُولَّد في تمريرة واحدة
التحريرتفاعلي متعدد الجولات — الكاميرا، الخلفيات، الكائنات، الإجراءات، الأسلوب
الفيزياءتحسين في الجاذبية والطاقة الحركية وديناميكيات السوائل
الإثباتعلامة مائية SynthID + بيانات اعتماد محتوى C2PA (إلزامي)
التوافرتطبيق Gemini وGoogle Flow (AI Plus/Pro/Ultra)؛ YouTube Shorts Remix وتطبيق Create (مجاني، +18)
وصول APIAPI عام عبر Vertex AI ينتشر في الأسابيع التالية لـ I/O 2026

لماذا يتميز Gemini Omni Flash

بنية نموذج omni الموحد

Gemini Omni Flash هو أول نموذج فيديو شحن من Google مبني على بنية omni موحدة قائمة على المحوّلات — نموذج واحد يتعامل مع النص والصورة والصوت والفيديو في تمريرة واحدة، مما يُزيل الفجوات بين الأنماط التي تُحدثها أنظمة الخطوط المنفصلة. يتيح تكديس المراجع الجمع بين صورة شخصية وملف صوتي ومرجع أسلوبي في موجه واحد.

التحرير التفاعلي متعدد الجولات

صِف التغييرات بلغة طبيعية ويُطبقها Gemini Omni Flash مباشرةً — غيّر الكاميرا، بدّل كائناً، أعِد كتابة مشهد، أو غيّر خلفية — مع إبقاء باقي المقطع سليماً. التعديلات متعددة الجولات تبني على السياق السابق حتى تتمكن من التكرار دون البدء من جديد.

صوت متزامن أصلي + فيزياء محسّنة

يُنتج حوار بمزامنة الشفاه وتأثيرات صوتية على الشاشة وصوت خلفية محيطة مع الفيديو في تمريرة أمامية واحدة — دون مرحلة TTS أو Foley منفصلة. يُوفر التحسين في فهم الجاذبية والطاقة الحركية وديناميكيات السوائل حركة أكثر واقعية، وكل مخرج يحمل إثبات SynthID وC2PA.

Gemini Omni Flash مقابل منشئات الفيديو الأخرى بالذكاء الاصطناعي

FeatureGemini Omni FlashVeo 3.1Sora 2Grok Imagine
المزودGoogle DeepMindGoogle DeepMindOpenAIxAI
البنيةنموذج omni موحد قائم على المحوّلاتالانتشارالانتشارAurora (تراجعي ذاتي)
التحرير التفاعلينعم — متعدد الجولاتلالالا
أقصى دقةعالية الدقة1080p1080p720p
أقصى مدة10 ثوانٍ (حد نشر)8 ثوانٍ (قابلة للتمديد)20 ثانية15 ثانية
الصوت الأصلينعم — تمريرة واحدةنعمنعمنعم
أوضاع الإدخالنص، صورة، صوت، فيديونص، صورة (حتى 3)نص، صورة + Cameosنص، صورة واحدة
القوالبنعملالالا
الإثباتSynthID + C2PASynthIDC2PA
التوافرتطبيق Gemini، Flow، YouTubeمتاحمتاحمتاح

ما يمكنك بناؤه مع Gemini Omni Flash

01

تحرير الفيديو التفاعلي

تخطَّ محرر الجدول الزمني كلياً — صِف التغيير المطلوب بلغة طبيعية ويُطبقه Gemini Omni Flash مباشرةً. غيّر زوايا الكاميرا، بدّل الكائنات، غيّر الخلفيات، أو أعِد كتابة إجراء كامل بموجه واحد.

02

محتوى اجتماعي قائم على القوالب

اختر قالباً مدمجاً، أضِف موجهك، واحصل على مقطع مُكوَّن بالكامل مدته 10 ثوانٍ مع صوت متزامن — مصمم لتنسيقات YouTube Shorts وReels وTikTok دون خبرة إنتاجية.

03

إنشاء مشاهد الحوار

أنشئ مشاهد محادثة واقعية بمزامنة شفاه دقيقة وصوت محيطة في تمريرة واحدة — مثالي للنصوص التسويقية والمحتوى التعليمي وحوار الأفلام القصيرة.

04

الإنشاء بتكديس المراجع

اجمع صورة شخصية وملف صوتي ومرجع أسلوبي في موجه واحد لتوليد شخصيات متسقة تتطابق مع مظهر وصوت وجماليات محددة عبر المقاطع.

05

لوحة قصص المشاهد

استعرض بسرعة نبضات السيناريو كمقاطع قصيرة بصوت أصلي. استخدم تحرير الدردشة متعدد الجولات لضبط التأطير واستبدال الكائنات أو إعادة كتابة الإجراءات عبر اللقطات دون إعادة الإنشاء من الصفر.

06

إنتاج فيديو العلامة التجارية

استخدم القوالب لإنتاج فيديو العلامة التجارية بسرعة، ثم حسّنه بالتحرير التفاعلي — بدّل لقطات المنتج، غيّر الخلفيات، أو اضبط النبرة البصرية لتتوافق مع علامتك التجارية.

استكشف منشئات الفيديو المرتبطة بالذكاء الاصطناعي

الأسئلة الشائعة حول Gemini Omni Flash

ما هو Gemini Omni Flash؟

Gemini Omni Flash هو نموذج توليد الفيديو الموحد الجديد من Google DeepMind، أُعلن عنه وأُطلق في Google I/O 2026 بتاريخ 19 مايو 2026. وهو أول نموذج شحن في عائلة Gemini Omni — مبني على بنية omni موحدة قائمة على المحوّلات تتعامل بشكل أصلي مع مدخلات النص والصورة والصوت والفيديو وتُنتج فيديو عالي الدقة بصوت متزامن في تمريرة واحدة. تشمل الميزات الرئيسية التحرير التفاعلي متعدد الجولات وتحسين فهم الفيزياء وتكديس المراجع.

كيف يختلف Gemini Omni Flash عن Veo 3.1؟

Veo 3.1 نموذج انتشار فيديو متخصص يركز بالكامل على تحويل النص والصورة إلى فيديو. Gemini Omni Flash مبني على بنية omni موحدة قائمة على المحوّلات — نموذج واحد يتعامل مع النص والصورة والصوت والفيديو في تمريرة واحدة، مشابه من حيث المفهوم لـ GPT-4o — ويربط توليد الفيديو بقدرات Gemini الاستدلالية. يُتيح ذلك التحرير التفاعلي متعدد الجولات وتكديس المراجع والإنشاء القائم على القوالب الذي لا يوفره Veo 3.1. يوفر Veo 3.1 حالياً مقاطع أطول وتحكماً أغنى في مدخلات متعددة الصور.

ما هو التحرير التفاعلي في Gemini Omni Flash؟

بمجرد حصولك على مقطع، تصف التغييرات بلغة طبيعية — 'حوّل زاوية الكاميرا إلى اليسار'، 'اجعل التمثال من فقاعات'، 'استبدل الكوب الأحمر بكوب قهوة'، أو 'أعِد كتابة هذا المشهد ليكون الشخصية في الخارج' — ويُعيد Gemini Omni Flash صياغة العنصر المستهدف مع إبقاء الباقي سليماً. التعديلات متعددة الجولات تبني على السياق السابق حتى تتمكن من التكرار دون إعادة البدء. تحرير الصوت على الفيديوهات الموجودة محجوب عمداً عند الإطلاق.

هل ينشئ Gemini Omni Flash صوتاً متزامناً؟

نعم. ينتج Gemini Omni Flash صوتاً متزامناً أصلياً — حوار بمزامنة الشفاه وتأثيرات صوتية متزامنة مع الإجراءات على الشاشة وصوت خلفية محيطة — في تمريرة أمامية واحدة جنباً إلى جنب مع الفيديو، دون مرحلة TTS أو Foley منفصلة. كل المخرجات المُولَّدة تُوسَم تلقائياً بعلامة مائية SynthID وبيانات اعتماد محتوى C2PA.

متى سيكون Gemini Omni Flash متاحاً على LoveGen AI؟

أُطلق Gemini Omni Flash في 19 مايو 2026 داخل تطبيق Gemini وGoogle Flow وYouTube Shorts Remix وتطبيق YouTube Create. وصول المطورين والمؤسسات العام عبر Vertex AI ينتشر في الأسابيع التالية لـ Google I/O 2026. ستدمج LoveGen AI نموذج Gemini Omni Flash فور إتاحة API للعموم.

ما قوالب الفيديو التي يتضمنها Gemini Omni Flash؟

يُشحن Gemini Omni Flash مع إنشاء فيديو قائم على القوالب، مُطبَّق بنقرة واحدة داخل تطبيق Gemini وGoogle Flow. تتعامل القوالب مع التكوين والإيقاع والصوت للإنشاء السريع، وتتوفر أيضاً إمكانية إنشاء صورة رمزية مخصصة بالذكاء الاصطناعي. كتالوج القوالب الحالي موجود داخل تطبيق Gemini وواجهات منتج Flow.