لا يوجد طلب سحب (Pull Request) للوكيل المستقل

تعتمد مراجعات الأمان التقليدية على الـ diff. يقوم شخص ما بفتح طلب سحب (pull request). ويقوم شخص آخر بقراءته. ويكون الكود في بيئة الإنتاج مطابقاً للكود الذي راجعته.

تكسر الوكلاء المستقلون (Autonomous agents) هذا النموذج.

يقوم الوكيل بالتخطيط واستدعاء الأدوات أثناء وقت التشغيل (runtime). فهو لا يرسل الإجراءات ضمن عملية إرسال الكود (commit)، بل يقرر الإجراءات أثناء تشغيله. إذا راجعت كود التطبيق فقط، فستفوتك المخاطر الحقيقية.

الوكيل ليس مجرد كود، بل هو إعدادات وقت التشغيل (runtime configuration). وتشمل هذه الإعدادات:

• المطالبة النظامية (system prompt) • الإطار أو الحلقة (harness or loop) • واجهة الأدوات (tool surface) • الذاكرة والهوية • سياسات الخروج من الشبكة (network egress policies) • صور الحاويات (container images)

يمكن لوكيلين يستخدمان نفس النموذج أن يتصرفا بشكل مختلف بناءً على هذه الإعدادات. يظل النموذج ثابتاً، لكن الإعدادات تغير كل شيء.

تتعامل العديد من الفرق مع المطالبات النظامية (system prompts) كإعدادات بسيطة في صندوق نصي، حيث يقومون بتعديلها عبر لوحة تحكم. وهذا خطأ؛ فتغيير سطر واحد قد يزيل أحد ضوابط الحماية (guardrail). فالمطالبة القابلة للتعديل هي مسار كود غير مراجع.

تثبت الحوادث الحقيقية ذلك:

• قدم بوت نصائح غير قانونية للملاك لعدة أسابيع. • بدأ بوت دعم فني في توجيه الشتائم للعملاء بسبب تحديث في المطالبة (prompt). • استخدمت ملفات خبيثة رموزاً غير مرئية لتجاوز القواعد.

لم تكن هذه إخفاقات في النموذج، بل كانت تغييرات في الإعدادات لم يراجعها أحد.

يجب عليك التعامل مع الإعدادات (configuration) كما تتعامل مع الكود.

ضع المطالبات النظامية وإعدادات الإطار (harness configs) في نظام التحكم في الإصدارات (version control). ولا تغيرها إلا من خلال طلبات السحب (pull requests). واستخدم الـ diffs لرؤية ما الذي تغير.

استخدم بصمة محتوى (content hash) لإعداداتك المنشورة. يجب أن تتضمن هذه البصمة إصدار المطالبة، ومعرف النموذج (model ID)، وملخص الحاوية (container digest). إذا قمت بتغيير المطالبة، فإن هوية الوكيل تتغير. لا يمكنك استبدال مطالبة بشكل صامت.

طبق خاصية اكتشاف الانحراف (drift detection) على واجهة الوكيل. لا تكتفِ بمراقبة المضيف (host) فحسب، بل راقب قوائم خادم MCP وسياسات الخروج (egress policies) الخاصة بذلك الوكيل.

عند تسجيل السجلات (logging)، تتبع هذين الأمرين:

• حجم السياق وقت اتخاذ القرار: ما هي كمية المعلومات التي كانت لدى النموذج عندما اتخذ الإجراء؟ • المطالبة الأب (parent prompt): في الأنظمة متعددة الوكلاء، ماذا أرسل الوكيل المستدعي؟

لست بحاجة إلى أدوات جديدة. استخدم نظام التحكم في الإصدارات وسجلات البيانات المهيكلة (structured logging) الموجودة لديك بالفعل. كل ما تحتاجه هو توجيهها إلى المكان الصحيح.

هل تقوم بإصدار ومراجعة مطالباتك النظامية؟ أم يمكن لأي شخص لديه صلاحية الوصول إلى وحدة التحكم (console) تغييرها دون ترك أي أثر؟

المصدر: https://dev.to/brennhill/theres-no-pull-request-to-review-for-an-autonomous-agent-so-what-do-you-review-355m

مجتمع تعليمي اختياري: https://t.me/GyaanSetuAi