قمت بإعادة تحسين مقدمة لعبة باستخدام الذكاء الاصطناعي عمرها 25 عاماً

قضيت وقتاً طويلاً في إعادة تحسين مقدمة لعبة من عام 2000. استخدمت الذكاء الاصطناعي لتحويلها إلى فيديو نقي بدقة 1080p.

تعلمت أن الملف المصدر أهم من نموذج الذكاء الاصطناعي نفسه.

إليكم أهم الدروس التي تعلمتها من هذا المشروع:

  • اختر أفضل مصدر. كان لدي نسخة بدقة 360p مع صوت جيد، ونسخة بدقة 1080p مع صوت سيء. اخترت نسخة الـ 1080p للفيديو ثم أضفت الصوت الجيد لاحقاً. احرص دائماً على تزويد أداة الـ upscaler بأعلى جودة ملف يمكنك العثور عليها.

  • استخدم مقاطع صغيرة للاختبار. لا تبدأ بمعالجة الفيديو الكامل مباشرة. لقد قضيت 16 ساعة في اختبار مقطع واحد مدته 5 ثوانٍ فقط. ساعدني هذا في العثور على الإعدادات الصحيحة دون إضاعة أيام من وقت المعالجة (compute time).

  • تحكم في الضجيج. الحركة السريعة تسبب الوميض (flickering). استخدمت مقياس latent_noise منخفض للوجوه للحفاظ على التفاصيل، واستخدمت مقياساً أعلى للحركة السريعة لمنع الذكاء الاصطناعي من "الهلوسة" وإضافة تفاصيل جديدة في كل إطار.

  • التقسيم حسب اللقطات، وليس حسب الوقت. استخدم أدوات مثل PySceneDetect للعثور على الانتقالات. لا تستخدم التقسيم القائم على الوقت، لأن التقسيم الزمني يسبب مشاكل في مزامنة الصوت. استخدم تقطيعاً دقيقاً بالإطارات (frame-exact cuts) للحفاظ على توافق الصوت والفيديو.

  • استخدم السحابة للمهام الكبيرة. كانت أجهزتي المحلية بطيئة. استأجرت GPU احترافية على vast.ai مقابل حوالي 2.70 دولاراً. لقد حول ذلك مهمة تستغرق 74 ساعة إلى مهمة تستغرق ساعتين فقط.

  • خدعة الرفع النهائية. قم برفع دقة الفيديو إلى 4K قبل رفعه على YouTube. يمنح YouTube معدلات بت (bitrates) أعلى لمقاطع فيديو 4K، مما يحافظ على حدة ووضوح فيديو الـ 1080p الخاص بك.

الكود الكامل ومسار العمل (pipeline) متاحان على GitHub.

المصدر: https://github.com/andyskw/ig2-solarian-seedvr2-remaster

مجتمع تعليمي اختياري: https://t.me/GyaanSetuAi