الذكاء الاصطناعي التوليدي يبني أشكالاً، لا ألعاباً
حاولت اختبار أداة جديدة في Minecraft تعتمد على "الأوامر النصية للبناء" (prompt-to-build). كنت أتوقع ثورة، ولكن بدلاً من ذلك، حصلت على مخطط لجدار.
يمكن للأداة إنشاء كرة أو برج في دقيقة واحدة، وتبدو هذه الأشكال جيدة. ولكن بمجرد أن طلبت قواعد محددة، فشلت الأداة.
طلبت كوخاً خشبياً بمقاس 15x15 مع باب يواجه الجنوب. أعطاني الذكاء الاصطناعي جداراً رمادياً بلا باب. كان المقاس خاطئاً، ولم يكن فيه خشب، وكان عديم الفائدة.
إليكم المشكلة الجوهرية:
النماذج التوليدية هي محركات "للمعقولية" (plausibility). أما الألعاب، فهي تحتاج إلى محركات "للدقة" (correctness).
يمكن للنموذج أن يصنع شيئاً يبدو "صحيحاً"، لكن اللعبة تحتاج إلى شيء "يكون" صحيحاً بالفعل. إن زيادة حجم النموذج لن يحل هذه المشكلة؛ فلا يمكنك الانتقال عبر التوسع من مرحلة "يبدو كمنزل" إلى مرحلة "منزل بباب يعمل".
توجد هذه الفجوة بسبب ثلاثة عناصر مفقودة:
- القيود المنفصلة (Discrete constraints): يمكن للنموذج تقريب مفهوم "صغير"، لكنه لا يستطيع ضمان "15 كتلة بالضبط".
- الهيكل التركيبي (Compositional structure): يمكن للنموذج رسم شكل ما، لكنه لا يستطيع إدارة مشهد يحتوي على كائنات متعددة وعلاقتها ببعضها البعض.
- الصحة الوظيفية (Functional correctness): لا يعرف النموذج ما إذا كان بإمكان اللاعب المرور فعلياً عبر بوابة، هو يعرف فقط كيف يبدو شكل البوابة.
لإصلاح ذلك، يجب أن نتوقف عن استخدام النماذج الضخمة الموحدة (monolithic models). نحن بحاجة إلى مسار عمل (pipeline) يفصل بين العناصر المستمرة (continuous) والمنفصلة (discrete):
- التخطيط (Plan): استخدام مخطط رمزي (symbolic planner) لتحويل الأمر النصي إلى قائمة صارمة من القواعد ومخطط للمشهد (scene graph).
- التوليد (Generate): استخدام النماذج التوليدية لإنشاء الأشكال الفردية لكل كائن.
- الوضع (Place): استخدام أداة حل (solver) لترتيب تلك الأشكال بحيث تستوفي جميع القواعد.
- التحقق (Verify): استخدام أداة فحص (checker) لإثبات أن النتيجة تطابق الخطة الأصلية.
المولد يوفر الجمال، بينما يوفر الهيكل الدقة.
مستقبل محتوى الذكاء الاصطناعي ليس نموذجاً واحداً عملاقاً، بل هو نظام من الأدوات المتخصصة التي تعمل معاً. الفائز لن يكون من يملك أفضل مولد للأشكال، بل من يملك أفضل حلقة تحقق (verification loop).
Optional learning community: https://t.me/GyaanSetuAi
