لماذا تنسى شخصيات الذكاء الاصطناعي هويتها
تقضي ساعتين في بناء شخصية ما. وبعد ثلاثين دورة حوارية، تنسى الشخصية اسمها، وتبدأ في التصرف كمساعد افتراضي عام.
يعتقد معظم الناس أن الذكاء الاصطناعي يعاني من ضعف الذاكرة. هذه الفكرة خاطئة.
المشكلة تكمن في نافذة السياق (context window).
نماذج الدردشة هي نماذج عديمة الحالة (stateless). في كل مرة ترسل فيها رسالة، يقوم التطبيق بإرسال المطالبة النظامية (system prompt)، وتفاصيل الشخصية، وسجل الدردشة الأخير الخاص بك مرة أخرى إلى النموذج.
ما تسميه ذاكرة ليس سوى بقاء السجل داخل نافذة الإدخال تلك.
عندما تصبح الدردشة طويلة جدًا، تخرج الرسائل القديمة من النافذة. تختفي التفاصيل من الدورة رقم 12 لتفسح المجال للدورة رقم 41. النموذج لا ينسى، بل يتوقف التطبيق ببساطة عن إظهار المعلومات له.
زيادة حجم نافذة السياق ليست هي الحل.
النوافذ الكبيرة تسبب مشكلتين:
- التكلفة والسرعة: مضاعفة حجم النافذة تزيد من احتياجات الحوسبة بشكل كبير. غالبًا ما تضع التطبيقات حدودًا للنافذة للحفاظ على سرعة الردود وانخفاض تكلفتها.
- تدهور الأداء في المنتصف (Middle degradation): تظهر الأبحاث أن النماذج تجد الحقائق جيدًا في بداية النص الطويل أو نهايته، لكنها تغفل عن الحقائق المدفونة في المنتصف.
أفضل التطبيقات لا تعتمد على الحجم الخام للنافذة، بل تستخدم طريقتين محددتين:
- التلخيص المتكرر (Recursive summarization): يقوم التطبيق بتحويل الرسائل القديمة إلى ملخص قصير، مما يحافظ على الحقائق الأساسية دون استهلاك مساحة كبيرة.
- الاسترجاع (Retrieval): يقوم التطبيق بتخزين الرسائل القديمة في قاعدة بيانات، ويستخرج فقط الحقائق ذات الصلة عندما تحتاج إليها. هذه هي الطريقة التي تعمل بها كتب القصص (lorebooks).
الفرق بين التطبيق الجيد والتطبيق السيئ هو البنية التحتية (architecture)؛ أحدهما يستخدم طبقة ذاكرة، والآخر ليس سوى غلاف بسيط فوق نافذة خام.
إذا فقدت شخصيتك طابعها، فلا تستخدم نموذجًا أكبر، بل قم بتغيير الهيكلية. لخص الدورات القديمة، واسترجع ما يهم.
تعامل مع نافذة السياق كأنها ذاكرة تخزين مؤقت (cache)، وليس قرصًا صلبًا.
مجتمع تعليمي اختياري: https://t.me/GyaanSetuAi