أقوم بتشغيل حلقة تحسين ذاتي لوكيل الذكاء الاصطناعي الخاص بي كل ليلة
كان وكيل الذكاء الاصطناعي الخاص بي يرتكب نفس الأخطاء. كان ينفذ مهمة، ويفشل بصمت، ثم يبلغ بأن كل شيء سار على أكمل وجه. لم يكن معطلاً، بل لم تكن لديه وسيلة للتعلم من أخطائه.
لقد قمت ببناء حلقة تحسين ذاتي لإصلاح ذلك.
كل ليلة في الساعة الثانية صباحاً، تبدأ جلسة معزولة. تقرأ السجلات (logs) من الـ 24 ساعة الماضية، وتجد الأنماط في الأشياء التي سارت بشكل خاطئ، ثم تقوم بتحديث ملفات ذاكرة الوكيل. لا يوجد تدخل بشري في هذه العملية.
إليك كيف يعمل الأمر:
- فصل المنفذ عن الناقد: يقوم الوكيل الرئيسي بتنفيذ المهام، بينما تقوم جلسة منفصلة بمراجعة العمل. لا يمكن لجلسة واحدة أن تكون القاضي والجلاد في آن واحد.
- استخدام ملفات بسيطة: أستخدم ملفات نصية عادية للذاكرة والتصحيحات، مما يحافظ على خفة النظام.
- فرض التحديد: لا أطلب من الوكيل "التحسن" فحسب، بل أطلب منه إيجاد الأنماط، وتقديم الأدلة، واقتراح إصلاح ملموس واحد.
أستخدم ثلاثة ملفات محددة لإدارة ذلك:
- السجلات اليومية (Daily logs): سجل خام لكل ما حدث.
- الدروس المتراكمة (Accumulated lessons): قواعد عالية القيمة يقرأها الوكيل في بداية كل جلسة.
- التصحيحات (Corrections): مكان للإصلاحات الأخيرة. إذا تكرر الخطأ ثلاث مرات خلال أسبوعين، يتم نقله إلى ملف الدروس الدائمة.
لم تكن النتائج فورية. في الأسابيع الثلاثة الأولى، كانت الملاحظات بديهية. وبحلول الأسبوع الرابع، وجد الوكيل مشكلات عميقة؛ حيث اكتشف أخطاء في التوقيت وأنماطاً خفية في رسائل الخطأ فاتني ملاحظتها.
الفائدة الأكبر هي الاستقرار. إذا عادت المشكلة بعد إصلاحها، فأنا أعلم أن إصلاحي كان خاطئاً. يتتبع النظام ما إذا كان الحل يعمل بالفعل أم لا.
للنظام حدود؛ فيمكنه رؤية الإخفاقات في السجلات، لكنه لا يستطيع رؤية الأخطاء في التقدير ما لم أقم بالإشارة إليها. لا يزال يتعين عليّ إخباره عندما يفعل الشيء الخاطئ لأسباب صحيحة.
يتطلب هذا الإعداد 50 سطراً من الإعدادات (config) ويعمل في أقل من دقيقتين. إنه يجعل الوكيل الخاص بي أفضل قليلاً في كل يوم.
مجتمع تعليمي اختياري: https://t.me/GyaanSetuAi