
Kling 3.0 التحكم في الحركة — تحريك شخصيات ذكاء اصطناعي مدفوع بالمرجع
ثبّت أي شخصية على أي حركة — من صورة واحدة ومقطع مرجعي
يحوّل Kling 3.0 التحكم في الحركة من Kuaishou صورة شخصية ثابتة إلى فيديو متحرك بالكامل، وذلك باستخراج الحركة من مقطع مرجعي تقدمه بنفسك. أضف صورة JPEG أو PNG لشخصيتك ومقطع مرجعي مدته 3–30 ثانية، وسيقوم Kling بنقل مسار الجسم الكامل وإيماءات اليدين والتعبيرات الوجهية الدقيقة وحركة الكاميرا إلى شخصيتك — مع الحفاظ على وجه الشخصية وملابسها وهويتها طوال الفيديو. يكون الإخراج بدقة 720p أو 1080p ويطابق المدة الزمنية الدقيقة للفيديو المرجعي. استخدم ميزة توجيه الشخصية لاختيار ما إذا كانت النتيجة تتبع وضعية الصورة (حد أقصى 10 ثوانٍ) أو اتجاه الفيديو (حد أقصى 30 ثانية). أضف عنصرًا مرجعيًا اختياريًا لتثبيت موضوع مخصص طوال المقطع. مبني على محرك الفيزياء Omni One، يوفر التحكم في الحركة توازنًا طبيعيًا وديناميكيات التلامس والحفاظ على الهوية بما لا تستطيع نماذج التحريك الأخرى مضاهاته.
تم إصدار Kling 3.0 التحكم في الحركة بواسطة Kuaishou إلى جانب نموذج Kling 3.0 الأساسي، وهو خط أنابيب تحريك مخصص مدفوع بالمرجع — مختلف تمامًا عن أوضاع تحويل النص إلى فيديو والصورة إلى فيديو القياسية. بدلًا من وصف الحركة في نص، تقدم حركتك الخاصة في شكل مقطع مرجعي مدته 3–30 ثانية. يستخرج النموذج مسار الحركة الكامل — حركيات الجسم، وتفاصيل اليدين، وديناميكيات الوجه، وحركة الكاميرا — ثم يعيد توجيهها نحو الشخصية في صورتك المرجعية.
ما يميزه هو الدقة في الجوانب الصعبة من تحريك الإنسان. إيماءات اليدين، التي كانت تمثل نقطة فشل تقليدية في فيديو الذكاء الاصطناعي، تُعرض الآن بدقة على مستوى الأصابع. تنتقل التعبيرات الوجهية الدقيقة بوضوح، مع حفاظ كامل على الهوية بزاوية 360 درجة يصمد أمام تغيير الزوايا. يتعامل محرك الفيزياء Omni One مع التوازن ونقل الوزن وديناميكيات القماش والتلامس بين أجزاء الجسم والأرض — بحيث لا تنزلق شخصيتك أو تطفو خلال الكوريغرافيا المعقدة. عندما تكون أجزاء من الجسم محجوبة في المرجع، يستعيدها النموذج بدلًا من إنتاج تشوهات.
يمنحانك وضعا التوجيه تحكمًا في كيفية تفاعل المواد المصدرية. توجيه الشخصية = الصورة يُبقي الشخصية موجهة بالطريقة التي تظهر بها في صورتك المرجعية ويدعم مدة تصل إلى 10 ثوانٍ — مثالي عندما تكون الصورة الثابتة قد أتقنت الوضعية التي تريدها. توجيه الشخصية = الفيديو يتبع إطار وتوجيه الفيديو المرجعي ويدعم المدى الكامل البالغ 30 ثانية — مثالي للكوريغرافيا الكاملة للجسم والرياضة وأي حركة تتضمن الالتفاف. دقة الإخراج 720p (قياسي) أو 1080p (احترافي). يمكن الاحتفاظ بصوت الفيديو المرجعي (افتراضي) أو كتمه بنقرة واحدة. لتحقيق اتساق الشخصية في المدى الطويل عبر جلسات التحكم في الحركة المتعددة، يمكنك تقديم element_id تم إنشاؤه مسبقًا لتثبيت الموضوع. يقع التحكم في الحركة جنبًا إلى جنب مع خط الأنابيب السينمائي القياسي لـ Kling 3.0 (متعدد اللقطات، 4K، صوت أصلي): استخدم النموذج الأساسي للتوجيه الإبداعي الأصلي، واستخدم التحكم في الحركة عندما تمتلك حركة مرجعية محددة تحتاج إلى نقلها إلى شخصية محددة.
كيفية استخدام Kling 3.0 التحكم في الحركة
ارفع صورة شخصيتك
اختر صورة JPEG أو PNG للشخصية التي تريد تحريكها — الجسم الكامل والرأس مرئيان بوضوح وغير محجوبين. نسبة الأبعاد بين 1:2.5 و2.5:1، مع أن يكون كل جانب 300px على الأقل والحجم الإجمالي أقل من 10MB.
ارفع فيديو الحركة المرجعي
أضف مقطعًا مدته 3–30 ثانية للحركة التي تريد نقلها. تظهر المدة المكتشفة وتكلفة الرصيد المباشرة فورًا. اختر 720p أو 1080p، وحدد توجيه الشخصية = صورة (≤10 ثوانٍ، الحفاظ على وضعية الصورة) أو فيديو (≤30 ثانية، اتباع إطار الفيديو).
أنشئ الفيديو وحمّله
أضف نصًا توجيهيًا اختياريًا لتحديد الخلفية أو الأسلوب، وفعّل الاحتفاظ بالصوت، وأضف معرّف العنصر في الإعدادات المتقدمة إن كان لديك واحد. انقر على إنشاء — يكتمل Kling عادةً في 3–6 دقائق. روابط الفيديو الناتجة صالحة لمدة 24 ساعة؛ حمّلها سريعًا.
المواصفات التقنية لـ Kling 3.0 التحكم في الحركة
| المزود | Kuaishou (Kling AI) |
| الإصدار | 2026 (مع Kling 3.0) |
| المدخلات | صورة مرجعية واحدة (.jpg, .jpeg, .png) + فيديو مرجعي واحد |
| حجم الصورة المرجعية | ≤ 10MB؛ ≥ 300px لكل جانب؛ نسبة الأبعاد من 1:2.5 إلى 2.5:1 |
| مدة الفيديو المرجعي | من 3 إلى 30 ثانية |
| مدة الإخراج | تطابق طول الفيديو المرجعي (3–30 ثانية) |
| دقة الإخراج | 720p (قياسي) أو 1080p (احترافي) |
| توجيه الشخصية | الصورة (≤10 ثوانٍ) أو الفيديو (≤30 ثانية) |
| الصوت | الاحتفاظ بالصوت المرجعي (افتراضي) أو الكتم |
| عنصر الموضوع | حتى 1 (عناصر video_refer فقط) |
| محرك الفيزياء | Omni One — التوازن والتلامس وديناميكيات القماش |
| الحفاظ على الهوية | 360° للوجه والجسم، استرداد الأجزاء المحجوبة |
| النص التوجيهي | اختياري، حد أقصى 2500 حرف |
| المعالجة | غير متزامن؛ رابط النتيجة صالح لمدة 24 ساعة |
لماذا يتميز Kling 3.0 التحكم في الحركة
الحركة المدفوعة بالمرجع تتفوق على الحركة المدفوعة بالنص
وصف الحركة في نص أمر هش: 'دوران أنيق على أطراف الأصابع' ينتج نتيجة مختلفة في كل مرة. يتيح لك التحكم في الحركة تقديم الحركة الدقيقة التي تريدها — من مقطع هاتفي أو فيديو رقص أو تسليط الضوء على رياضي — وإعادة توجيهها نحو شخصيتك. تحصل على دقة الأداء الحقيقي دون تصوير الموضوع الفعلي.
مصمم للأجزاء الصعبة: الأيدي والوجوه والفيزياء
قام إصدار V3.0 تحديدًا بترقية نقاط الفشل التي ابتليت بها تحريك شخصيات الذكاء الاصطناعي: تفاصيل اليدين والتعبيرات الوجهية الدقيقة والتلامس الجسدي. بدعم من محرك الفيزياء Omni One، يتعامل مع التوازن ونقل الوزن واسترداد الأجزاء المحجوبة — بحيث يُعرض الرقص والفنون القتالية والكوريغرافيا المعقدة بشكل طبيعي بدلًا من مجرد قطع طافية أو منزلقة.
حتى 30 ثانية بدقة 1080p مع الحفاظ على الهوية
تحد معظم نماذج التحريك من مدتها إلى 5–10 ثوانٍ. يعمل التحكم في الحركة لمدة تصل إلى 30 ثانية مطابقةً لفيديوك المرجعي، مع حفاظ كامل على هوية الوجه والجسم بزاوية 360 درجة عبر تغييرات الزوايا. مقترنًا بعنصر الموضوع الاختياري لتثبيت المظهر عبر الإصدارات، هو خط أنابيب تحريك الشخصيات الأكثر استعدادًا للإنتاج المتاح.
Kling 3.0 التحكم في الحركة مقابل نماذج التحريك الأخرى
| Feature | Kling 3.0 التحكم في الحركة | Kling 3.0 (صورة إلى فيديو) | Runway Act-One | Wan Animate |
|---|---|---|---|---|
| المدخلات | صورة + فيديو مرجعي | صورة + نص توجيهي | صورة + فيديو مُشغّل (وجه) | صورة + فيديو مُشغّل |
| مصدر الحركة | الجسم الكامل والأيدي والوجه والكاميرا | نص توجيهي | أداء الوجه فقط | الجسم + الوجه |
| الحد الأقصى للمدة | 30 ثانية | 15 ثانية | 10 ثوانٍ نموذجيًا | 5–10 ثوانٍ نموذجيًا |
| الحد الأقصى للدقة | 1080p | 4K | 720p | 720p |
| دقة إيماءات اليدين | عالية (ترقية V3) | تعتمد على النص التوجيهي | غير متاح | متوسطة |
| الحفاظ على الهوية | 360°، استرداد الأجزاء المحجوبة | المرجع + العناصر | مثبّت على الوجه | مثبّت على المرجع |
| الفيزياء | محرك Omni One | حركة واعية بالفيزياء | محدود | محدود |
| الأنسب لـ | الرقص والرياضة والأداء الكامل | السرد السينمائي | تمثيل الرأس الناطق | تحريك الشخصيات الخفيف |
ما الذي يصنعه المبدعون باستخدام Kling 3.0 التحكم في الحركة
فيديوهات الرقص والكوريغرافيا
التقط روتين رقصة على هاتفك، وأضفه كفيديو مرجعي، ثم انقله إلى أي شخصية — رمزك الشخصي، أو شخصية مرسومة، أو صورة مشابهة لمشهور، أو تميمة نمطية. تنتقل إيماءات الأيدي وحركات القدم بنظافة بفضل ترقية V3.
مشاهد الرياضة والأكشن
استخدم تسليطًا رياضيًا أو مقطع باركور كمرجع، وطبّق الحركة على تميمة علامة تجارية أو شخصية خيالية. يتعامل محرك Omni One مع تغييرات الاتجاه السريعة والتلامس وتدورات الجسم الكاملة التي ستنهار عادةً في تحويل النص إلى فيديو بالنص.
تحريك تميمة العلامة التجارية
أحيِ رسمًا توضيحيًا ثابتًا للعلامة التجارية بحركة مستخرجة من مؤدٍّ حقيقي. مع عنصر الموضوع، يمكنك تثبيت مظهر التميمة عبر حملة كاملة — نفس النسب، نفس التفاصيل، مقاطع حركة مختلفة لإعلانات مختلفة.
إدراج الأداء في فيديوهات الموسيقى
أشِر إلى كوريغرافيا فنان وطبّقها على نسخة مُنمّقة من الفنان، أو على شخصيات متعددة عبر مقاطع. يعني مرور الصوت الأصلي أن موسيقى المرجع أو التزامن الصوتي يبقى مضمّنًا في النتيجة دون إعادة معالجة صوتية.
اتجاهات التواصل الاجتماعي القصيرة
أعد إنشاء رقصة رائجة أو حركة أو تعبير باستخدام صورة شخصيتك الخاصة. تغطي مدة تصل إلى 30 ثانية تقريبًا كل قالب قصير (TikTok, Reels, Shorts)، ودقة 720p أكثر من كافية لخلاصات الهاتف المحمول العمودية.
التصور المسبق لالتقاط الأداء
استخدم لقطات مرجعية بجودة الهاتف لممثل أو مزدوج خطير لتصوّر مسبق لكيفية تحرك الشخصية النهائية — قبل وقت طويل من الوصول إلى مرحلة mocap. يمنح الحفاظ على الهوية عبر 30 ثانية المخرجين شيئًا ملموسًا لمناقشته مع فرق VFX والكوريغرافيا والأداء.
استكشف نماذج فيديو الذكاء الاصطناعي ذات الصلة
Kling 3.0
نموذج Kling 3.0 الأساسي مع توجيه متعدد اللقطات وإخراج 4K وصوت أصلي.
Kling 2.5 Turbo
نموذج Kuaishou المحسّن للسرعة بدقة 1080p لإنتاج حجم كبير بسرعة.
Kling v2.1
صورة إلى فيديو مع التحكم في الإطار الأول/الأخير للانتقالات الموجهة.
Happy Horse 1.0
محوّل موحد الأعلى تصنيفًا مع مرجع إلى فيديو وصوت بـ 6 لغات.

Veo 3.1
نموذج Google DeepMind بدقة 1080p مع إطارات إلى فيديو وصوت متزامن.

Sora 2
نموذج OpenAI بدقة 1080p مع مقاطع تصل إلى 20 ثانية وميزة Cameos.
الأسئلة الشائعة حول Kling 3.0 التحكم في الحركة
ما الذي يفعله Kling 3.0 التحكم في الحركة بالضبط؟
يُحرّك صورة شخصية ثابتة باستخدام حركة مستخرجة من فيديو مرجعي تقدمه. بدلًا من وصف الحركة في نص، تقوم برفع مقطع مدته 3–30 ثانية لشخص (أو شيء) يتحرك بالطريقة التي تريدها — يرقص، يمشي، يومئ، يؤدي — ويقوم Kling بنقل مسار الجسم الكامل وإيماءات اليدين والتعبيرات الوجهية الدقيقة وحركة الكاميرا إلى الشخصية في صورتك. يحافظ الإخراج على وجه شخصيتك وملابسها وهويتها مع تبني حركة المقطع المرجعي.
ما الفرق بين توجيه الشخصية = صورة وتوجيه الشخصية = فيديو؟
يُبقي توجيه الصورة الشخصية موجهة بالطريقة التي تظهر بها في صورتك المرجعية (الصورة الثابتة تقود الوضعية) وهو محدود بـ 10 ثوانٍ — مثالي عندما تكون الصورة قد أتقنت المظهر الذي تريده. يتبع توجيه الفيديو إطار وتوجيه الفيديو المرجعي ويدعم المدى الكامل البالغ 30 ثانية — مثالي للكوريغرافيا الكاملة للجسم والرياضة وأي حركة تتضمن الالتفاف. إذا كنت تستخدم عنصر موضوع (element_list)، فإن توجيه الفيديو فقط هو المدعوم.
ما نوع الفيديو المرجعي الأنسب للاستخدام؟
الأنسب هو مقطع واضح مدته 3–30 ثانية مع رؤية كاملة للجسم وحركة ثابتة وموضوع واضح. يجب أن تتطابق نسب الشخصية في المرجع تقريبًا مع شخصية صورتك. تجنب الاهتزاز الشديد للكاميرا وتعدد المواضيع والحركة الفوضوية. يتعامل محرك الفيزياء Omni One مع الحركات المعقدة (الرقص، فنون الدفاع عن النفس، الرياضة) بشكل نظيف، ويمكن للنموذج استرداد أجزاء الجسم المحجوبة مؤقتًا في المرجع.
كيف تُحدد مدة الإخراج وسعره؟
تطابق مدة الإخراج مدة الفيديو المرجعي (مقربة إلى ثوانٍ صحيحة). تتوسع الأسعار مع الجودة والمدة: 1080p × 30 ثانية ≈ 50 رصيدًا، 1080p × 10 ثوانٍ ≈ 20 رصيدًا، مع انخفاض السعر للمدد الأقصر حتى الحد الأدنى البالغ 10 أرصدة. دقة 720p تكلف تقريبًا 75% من 1080p لنفس المدة. يعرض زر الإنشاء السعر المباشر لملفاتك المرفوعة تحديدًا.
هل أحتاج إلى كتابة نص توجيهي؟
النص التوجيهي اختياري. يمكنك تركه فارغًا وسيستنتج النموذج المشهد من صورتك المرجعية وفيديوك المرجعي. إضافة نص توجيهي مفيدة عندما تريد التأثير على الخلفية أو الإضاءة أو الأسلوب — مثلًا: 'إضاءة سينمائية، خلفية حضرية ضبابية، ساعة الذهب'. حركة الشخصية تأتي من الفيديو المرجعي في كلتا الحالتين.
هل يمكنني الاستمرار في استخدام نفس الشخصية عبر إصدارات متعددة؟
نعم. يتيح لك حقل عنصر الموضوع في الإعدادات المتقدمة تقديم element_id أنشأته مسبقًا (عبر Kling Custom Element باستخدام video_refer). عند التعيين، يُثبّت النموذج هوية تلك الشخصية عبر الإصدارات، حتى لو تغيرت الصورة المرجعية. ملاحظة: يستلزم عنصر الموضوع توجيه الشخصية = فيديو، ويُدعم عنصر واحد فقط لكل جلسة تحكم في الحركة.