ByteDance تكشف عن Seedance 2.5: عصر جديد للفيديوهات الطويلة بالذكاء الاصطناعي
تعمل ByteDance على توسيع آفاق الوسائط التوليدية مع الإعلان عن Seedance 2.5، وهو نموذج رائد قادر على إنتاج مقاطع فيديو ممتدة بالذكاء الاصطناعي. ويمثل هذا النموذج الجديد، الذي تم الكشف عنه في مؤتمر Volcano Engine FORCE، قفزة نوعية كبيرة في الاتساق الزمني والتحكم الإبداعي للمبدعين المحترفين.
كسر حاجز الـ 30 ثانية
يتمثل الإنجاز الأبرز لـ Seedance 2.5 في قدرته على إنشاء مقاطع فيديو فردية تصل مدتها إلى 30 ثانية في عملية توليد واحدة. وعلى عكس الأجيال السابقة من نماذج فيديو الذكاء الاصطناعي التي تتطلب "ربط" (stitching) مقاطع قصيرة متعددة معاً — وهي عملية غالباً ما تؤدي إلى وميض بصري أو أخطاء في الاستمرارية — يتعامل Seedance 2.5 مع الانتقالات المعقدة بشكل أصلي. يمكن للنموذج تنفيذ تغييرات متعمدة في المشاهد وتحولات في الإيقاع ضمن عملية توليد واحدة، مما يضمن تجربة سينمائية سلسة.
لتعزيز الدقة الإبداعية، يدعم Seedance 2.5 ما يصل إلى 50 مدخلاً إضافياً متزامناً. يتيح ذلك للمستخدمين تزويد النموذج بصور مرجعية، وملفات صوتية محددة، وبيانات أخرى متعددة الوسائط. وبالنسبة لصناع الأفلام وشركات الإنتاج، تعد هذه القدرة بالغة الأهمية عند إخراج مشاهد تتضمن شخصيات متعددة أو متطلبات بيئية محددة، حيث توفر مستوى من التحكم الدقيق لم يسبق له مثيل في الذكاء الاصطناعي التوليدي الموجه للمستهلكين.
دقة بصرية محسنة وتحرير ما بعد التوليد
بالإضافة إلى المدد الزمنية الأطول، تعمل ByteDance على ترقية معاييرها البصرية. يدعم نموذج Seedance 2.0 الحالي الآن دقة 4K أصلية مع عمق ألوان 10-bit، مما يوفر النطاق الديناميكي العالي المطلوب لسير عمل البث والأفلام الاحترافية.
علاوة على ذلك، تقدم ByteDance قدرات تحرير متطورة لما بعد التوليد. يمكن للمستخدمين الآن تعديل العناصر داخل الفيديو الذي تم إنشاؤه مع الحفاظ على النمط البصري الأصلي والنزاهة الجمالية. وهذا يحل إحدى أكبر المشكلات في إنتاج فيديو الذكاء الاصطناعي: عدم القدرة على إصلاح الأخطاء الطفيفة دون إعادة توليد التسلسل بأكمله وفقدان "المظهر" الأصلي.
منظومة شاملة متعددة الوسائط
يأتي الإعلان عن Seedance كجزء من طرح أوسع لخمسة نماذج ذكاء اصطناعي جديدة من خلال Volcano Engine، وهو قطاع الأعمال السحابية الموجه للمؤسسات التابع لشركة ByteDance. تم تصميم هذه المنظومة لتوفير مجموعة أدوات متكاملة للمطورين والشركات:
- Doubao 2.1 Pro: نموذج لغوي عالي الأداء يُقال إن تكلفته أقل بنسبة 80% تقريباً من Claude Opus 4.6، مما يضع ByteDance كمنافس رئيسي في سوق النماذج اللغوية الكبيرة (LLM) ذات التكلفة الفعالة.
- Seedream 5.0 Pro: نموذج متطور لتوليد الصور للحصول على أصول بصرية عالية الدقة.
- Seed-Audio 1.0: نموذج صوتي مخصص لتكملة سير عمل الفيديو والنصوص.
من خلال دمج هذه النماذج، لا تطلق ByteDance مجرد أداة واحدة، بل محركاً متماسكاً ومتعدد الوسائط مصمماً لتمكين الجيل القادم من إنشاء المحتوى الآلي.
النقاط الرئيسية
- استمرارية ممتدة: يكسر Seedance 2.5 حاجز الـ 30 ثانية، حيث يقوم بتوليد فيديوهات طويلة مع تغييرات أصلية في المشاهد دون الحاجة إلى عملية الربط اللاحقة.
- تحكم متعدد الوسائط: يقبل النموذج ما يصل إلى 50 مدخلاً متزامناً، بما في ذلك الصور والصوت، مما يسمح بإدارة معقدة للشخصيات والمشاهد.
- التوسع للمؤسسات: تنافس ByteDance بقوة في السعر والأداء، حيث يوفر نموذجها Doubao 2.1 Pro LLM مزايا كبيرة من حيث التكلفة مقارنة بقادة الصناعة مثل Anthropic.
