عندما يسيء الوكيل التصرف، هل تعرف أيهما فعل ذلك؟
يقوم وكيل بحذف سجل لا ينبغي له المساس به. يرسل رسالة إلى مستأجر (tenant) خاطئ. يستدعي واجهة برمجة تطبيقات (API) في حلقة تكرارية مما يؤدي إلى ارتفاع فواتيرك بشكل مفاجئ.
بعد عشر دقائق من وقوع حادثة ما، ستطرح سؤالاً واحداً: أي وكيل فعل هذا؟
إذا كنت لا تعرف، فلن تتمكن من إصلاحه. لن تتمكن من إيقاف عملية البناء (build). لن تتمكن من تدقيق الخطأ. لن تتمكن من التعلم من الخطأ.
هذه مشكلة هوية.
تواجه معظم الفرق ثلاثة أنماط تخفي أفعال الوكلاء:
- حسابات الخدمة المشتركة: يستخدم عشرة وكلاء مجموعة واحدة من بيانات الاعتماد. تظهر كل عملية بشكل متطابق في سجلاتك.
- بيانات اعتماد بشرية: يستخدم الوكيل بيانات تسجيل الدخول الخاصة بك. تظهر السجلات اسمك أنت، وليس اسم الوكيل. وهذا يخلق مخاطرة أمنية جسيمة.
- الانحراف الصامت (Silent drift): يستخدم إصداران مختلفان من البناء (builds) نفس الاسم. يستخدم أحدهما نموذجاً جديداً أو أمراً (prompt) جديداً، لكن السجلات تظهر نفس الهوية.
لإصلاح ذلك، اتبع الخطوات التالية:
امنح كل وكيل هويته الخاصة. لا تستخدم بيانات اعتماد بشرية. لا تستخدم حسابات مشتركة. يجب أن يقوم الوكيل بالمصادقة ككيان مستقل.
قم بتدوين ستة حقول محددة في كل عملية:
- الطرف المسؤول (Accountable party): من المسؤول عن هذا الوكيل؟
- المالك التشغيلي (Operational owner): من يقوم بصيانته يومياً؟
- المستأجر (Tenant): لأي عميل يخص هذا؟
- معرف نوع الوكيل (Agent-type-id): أي إصدار بناء محدد هذا؟
- معرف مثيل الوكيل (Agent-instance-id): أي عملية تشغيل محددة هذه؟
- سياق التتبع (Trace context): أين يقع هذا في سلسلة الاستدعاءات؟
استخدم الهاش (hashes) للإصدارات. لا تسمِّ وكيلك "support-agent-v2". إذا قمت بتغيير الأمر البرمجي للنظام (system prompt)، سيبقى الاسم كما هو، لكن السلوك سيتغير. بدلاً من ذلك، استخدم هاش المحتوى (content hash). أنشئ هاشاً بناءً على صورة الحاوية (container image)، والأمر (prompt)، والنموذج (model)، والإعدادات (config). إذا قمت بتغيير سطر واحد من الكود، سيتغير المعرف (ID). هذا يجعل الانحراف الصامت مرئياً.
سجل تسلسل النسب (lineage). الوكلاء يولدون وكلاء فرعيين. يجب عليك تسجيل أي وكيل أب هو من بدأ الوكيل الفرعي. يجب عليك أيضاً تسجيل الأمر (prompt) الذي أعطاه الأب للوكيل الفرعي. هذه هي الطريقة الوحيدة للعثور على التعليمات المحقونة أو البيانات المسمومة.
الهوية هي مساحة التعافي الخاصة بك. فهي تتيح لك استخدام مفتاح الإيقاف (kill switch) وبناء سجل تدقيق (audit trail). يجب عليك إعداد ذلك قبل وقوع أي حادثة. إن إضافة الهوية أثناء الأزمة هو أمر فات أوانه.
تحقق من سجلاتك الآن. انظر إلى عملية تمت قبل ساعة. هل يمكنك تحديد إصدار البناء (build) المحدد الذي قام بتلك العملية؟ إذا لم تستطع، فهناك فجوة يجب عليك سدها.
المصدر: https://dev.to/brennhill/when-your-agent-does-something-bad-can-you-tell-which-agent-did-it-37a2
مجتمع تعليمي اختياري: https://t.me/GyaanSetuAi
