محتوى

Kling O3: نموذج توليد فيديو ذكاء اصطناعي شامل

يدمج Kling O3 توليد فيديو من النص وتوليد فيديو من الصورة والتوليد بالمرجعية وتحويل الفيديو في نموذج واحد، مع دعم أصلي لتوليد المؤثرات الصوتية وإخراج 1080p بدقة عالية.

تغطي هذه الصفحة القدرات الأساسية لـ Kling O3 واختيار سير العمل وإنشاء الصوت ومستويات الجودة وتسعير الرصيد، مما يساعد المبدعين على تقييم هذا النموذج بشكل شامل.

اختر وضع Kling O3 المناسب

يغطي Kling O3 سير العمل الكامل لتوليد الفيديو على منصة واحدة. حسب نوع الإدخال الخاص بك — النص أو الصورة أو الفيديو المرجعي أو المواد الموجودة — اختر الوضع المناسب للحصول على مخرجات عالية الجودة وموحدة.

  • من النص إلى الفيديو: ابدأ من المطالبة، تحكم كاملاً في الطول ونسبة العرض إلى الارتفاع.
  • من الصورة إلى الفيديو: أضف حركة إلى صورة ثابتة، مع خيار الصوت، طول يصل إلى 15 ثانية.
  • من المرجع إلى الفيديو: ادمج الفيديو المصدري والصور المرجعية، حافظ على اتساق الموضوع عبر الأجزاء.

خيارات الصوت والجودة

يوفر إنشاء الصوت الأصلي تجاوز معالجة الصوت اللاحقة المنفصلة. يتيح لك منتقي جودة 720p/1080p المرونة في الموازنة بين سرعة الإنشاء وحجم الملف والدقة الإخراج بناءً على متطلبات التسليم.

  • توفر أوضاع من النص إلى الفيديو والصورة إلى الفيديو مفتاح الصوت.
  • 720p مناسب للإخراج السريع، 1080p مناسب للتسليم النهائي.
  • توفر أوضاع المرجع إلى الفيديو وتحويل الفيديو خيار "الاحتفاظ بالصوت الأصلي".

مقارنة كفاءة الرصيد بين الأوضاع

يتغير رصيد من النص إلى الفيديو والصورة إلى الفيديو بشكل ديناميكي مع الطول والجودة وإعدادات الصوت. يتغير رصيد المرجع إلى الفيديو فقط مع الطول والجودة. بسبب اعتماد مدة إخراج تحويل الفيديو على الإدخال، يتم فرض معدل ثابت حسب مستوى الجودة. في مرحلة التطوير، يُنصح باستخدام 720p مع إيقاف الصوت لإكمال كل جزء بأقل تكلفة رصيد.

Kling O3: نموذج توليد فيديو رباعي الوظائف الشامل

1

أربع قدرات، نموذج واحد

توليد فيديو من النص وتوليد فيديو من الصورة والتوليد بالمرجعية وتحويل الفيديو، كل ذلك يعمل على نفس بنية Kling O3 الموحدة. قم بالتبديل بحرية بين سير العمل دون الحاجة إلى تغيير النموذج، والجودة تبقى متسقة.

2

إنشاء المؤثرات الصوتية الأصلية، بجودة قابلة للتحكم

قم بتفعيل ميزة الصوت لإضافة صوت محيط وموسيقى خلفية ومؤثرات صوتية مباشرة أثناء الإنشاء. اختر 720p للتكرار السريع أو 1080p للتسليم النهائي - كلا الدقتين تدعمان نطاق الطول الكامل من 3 إلى 15 ثانية.

3

التوجيه بالمراجع ووضع تحرير الفيديو

قدّم ما يصل إلى 4 صور مرجعية مع فيديو مصدر لضمان اتساق الموضوع عبر الأجزاء. يمكن لوضع تحويل الفيديو إعادة تشكيل الأسلوب للمواد الموجودة مع الحفاظ على هيكل الحركة الأصلي.

الأسئلة الشائعة

يدعم Kling O3 أربع أنماط توليد في نموذج واحد: توليد فيديو من النص (التوليد بناءً على نص الطلب)، وتوليد فيديو من الصورة (إضافة تأثيرات حركة للصور الثابتة)، والتوليد بالمرجعية (استخدام فيديو المصدر مع صور مرجعية للحفاظ على اتساق الموضوع)، وتحويل الفيديو (إعادة عرض المواد الموجودة من خلال نص طلب وأسلوب جديد). تشارك الأنماط الأربعة نفس البنية الأساسية، مع معايير جودة متسقة.

يأخذ وضع المرجع إلى الفيديو فيديو مصدرًا وما يصل إلى 4 صور مرجعية كمدخلات. يستخدم النموذج الصور المرجعية للحفاظ على اتساق مظهر الموضوع في الأجزاء المُنشأة - بما فيها ملامح الوجه والملابس وشكل الكائن - مع اتباع هيكل الحركة لفيديو المصدر. طول هذا الوضع محدود بـ 10 ثوان، وهو مثالي لاحتياجات الاتساق في الشخصيات في الإنتاج المتعدد الأجزاء.

يأخذ وضع تحويل الفيديو فيديو موجودًا ومطالبة نصية كمدخلات ويعيد عرض المواد بأسلوب بصري جديد تماما. مدة الإخراج تطابق الجزء الإدخال، لذلك هذا الوضع لا يحتوي على شريط تمرير الطول. مناسب لإعادة تشكيل أسلوب المواد واستبدال المشهد وتطبيق المرشحات الفنية أو تحديث الأساس البصري للمحتوى الموجود بدون إعادة تصوير.

نعم. يوفر وضع النص إلى الفيديو والصورة إلى الفيديو كلاهما مفتاح الصوت. عند تفعيله، سينشئ Kling O3 تلقائيًا صوتًا محيطًا وموسيقى خلفية ومؤثرات صوتية مطابقة لمحتوى البصري. لا تدعم أوضاع المرجع إلى الفيديو وتحويل الفيديو إنشاء الصوت، ولكنها توفر خيار "الاحتفاظ بالصوت الأصلي" للاحتفاظ بمسار الصوت للمواد المصدرية.

720p له حجم ملف أصغر وسرعة إنشاء أسرع، مناسب لمعاينة المسودات والتكرار السريع. 1080p يوفر دقة إخراج أعلى، مناسب للتسليم النهائي والنشر على وسائل التواصل الاجتماعي والاستخدام المهني. كلا الجودتين تدعمان نطاق الطول الكامل. نظرًا لأن 1080p يتطلب المزيد من القدرة الحسابية، فإن الرصيد المستهلك في الثانية الواحدة أعلى أيضًا.

يعتمد استهلاك الرصيد من النص إلى الفيديو والصورة إلى الفيديو على ثلاثة عوامل: الطول (3 إلى 15 ثانية) والجودة (720p أو 1080p) وما إذا كان الصوت قيد التشغيل. يعتمد رصيد المرجع إلى الفيديو فقط على الطول (3 إلى 10 ثوان) والجودة. يعتمد رصيد تحويل الفيديو على الجودة فقط لأن مدة الإخراج يحددها الإدخال. تؤدي الجودة الأعلى وتفعيل الصوت إلى زيادة استهلاك الرصيد.

Premium background

هل أنت جاهز لتحويل أفكارك إلى واقع؟

انضم إلينا لإنشاء مقاطع فيديو وصور مذهلة من خلال منصة موحدة واحدة.

بدون تبديل الحسابات، بدون تعقيد - فقط النتائج.