الحظر ليس فشلاً: الوكلاء بحاجة إلى ملاحظات حول الحدود
تتعامل معظم إعدادات الوكلاء مع الإجراء المحظور على أنه فشل في الأداة.
يقوم الوكيل باستدعاء أداة ما. ينتهك الطلب قاعدة معينة. يعيد النظام خطأً عاماً. يفشل استدعاء الأداة.
يبدو هذا جيداً في البداية؛ فقد تم إيقاف الإجراء غير الآمن. لكن هذا لا يحل سوى نصف المشكلة.
الخطأ العام لا يساعد الوكيل على العمل ضمن حدوده، بل يحول قرار السياسة إلى مجرد ضجيج. قد يحاول الوكيل تخمين الإصلاح، أو قد يكرر نفس الخطأ أو يحاول استخدام حمولة (payload) مختلفة، مما يؤدي إلى حلقة من المحاولات غير المجدية.
يجب أن يكون الإجراء المحظور قراراً مهيكلاً، وليس انهياراً غير متوقع.
عندما يتم حظر طلب ما، يجب ألا يتغير النظام الخارجي، ومع ذلك، يجب أن يخبر الرد الوكيل بكيفية المضي قدماً بأمان.
بدلاً من الخطأ البسيط، استخدم رداً مهيكلاً.
تخيل أن وكيلاً يحاول الكتابة في ملف تغير أثناء عملية التخطيط. الخطأ العام يقول "فشل". أما الرد المهيكل فيقول:
- حالة القرار: تعارض
- حالة النتيجة: لا يوجد تأثير
- السبب: حالة قديمة (stale state)
- الإجراء التالي: إعادة قراءة الحالة المستهدفة
الآن يدرك الوكيل أن الهدف ليس مستحيلاً، بل يحتاج فقط إلى تحديث معلوماته. يتوقف عن التخمين ويتخذ الخطوة التالية الصحيحة.
يعمل هذا في العديد من السيناريوهات:
- إذا كان المسار خارج النطاق، اقترح مساراً مسموحاً به.
- إذا كان التأثير موجوداً بالفعل، اقترح إعادة استخدام النتيجة.
- إذا كان التأثير كبيراً جداً، اقترح الانتظار للمراجعة البشرية.
هذا لا يجعل الحدود مرنة؛ فسيظل الإجراء محظوراً، وسيظل النظام آمناً. أنت ببساطة تحول طريقاً مسدوداً إلى مسار موجه.
يجب عليك موازنة ذلك مع الأمن؛ فالملاحظات الدقيقة قد تساعد الوكيل السيئ على اختبار حدودك.
استخدم رموز أسباب واضحة للاحتكاكات التشغيلية مثل البيانات القديمة أو المدخلات غير الصالحة. إذا أظهر الوكيل سلوكاً مشبوهاً أو تجاهل التلميحات، فقم بالتحول إلى الرفض العام أو المراجعة البشرية.
افصل بين ملاحظات الوكيل ودرجات التدقيق. يحتاج الوكيل إلى معرفة كيفية الامتثال، بينما يحتاج النظام إلى معرفة ما إذا كان الوكيل يتصرف بشكل سيئ. لا تخلط بين هاتين الوظيفتين.
توجد الحدود لأن الوكلاء أصبحوا مفيدين بما يكفي للتفاعل مع الأنظمة الحقيقية. والعمل الحقيقي له قواعد وحدود.
الحد الذي يعيد فشلاً فقط هو جدار. أما الحد الذي يوفر التوجيه فهو أداة.
يجب أن تعني حالة Blocked ما يلي:
- لم يتحقق التأثير المطلوب.
- السبب معروف.
- الإجراء الآمن التالي واضح.
المصدر: https://dev.to/davidloibner/blocked-is-not-failed-agents-need-boundary-feedback-bbg
مجتمع تعليمي اختياري: https://t.me/GyaanSetuAi