ما هو الـ Multi-Agent SRE؟
تسعى فرق الـ SRE إلى استخدام الذكاء الاصطناعي. تفشل معظم الفرق لأنها تتعامل مع الذكاء الاصطناعي كأداة واحدة. بدلاً من ذلك، يجب عليك التعامل مع الذكاء الاصطناعي كفريق من الوكلاء (agents).
إن الاعتماد على نموذج واحد ضخم للتعامل مع حادثة ما يفشل في بيئة الإنتاج. ويفشل ذلك لثلاثة أسباب:
- حدود السياق (Context limits). الحوادث الحقيقية تحتوي على كمية بيانات ضخمة تفوق قدرة مطالبة (prompt) واحدة.
- نقص التخصص. فالكشف (Detection)، والفرز (Triage)، والمعالجة (Remediation) هي مهام مختلفة. ولا يمكن لمطالبة واحدة القيام بالمهام الثلاث بكفاءة.
- مشكلات الثقة. لا يمكنك مراجعة نموذج واحد غامض (opaque). كما لا يمكنك إيقافه مؤقتًا أو تسليم أجزاء من عمله إلى إنسان.
يقوم النظام متعدد الوكلاء بتقسيم دورة حياة الحادثة إلى متخصصين.
• وكيل الكشف (Detection agent). يراقب الإشارات ويحدد الحوادث. • وكيل الربط (Correlation agent). يجمع التنبيهات ذات الصلة ويزيل الضجيج. • وكيل التحقيق (Investigation agent). يفحص السجلات (logs) والتتبعات (traces) للعثور على الأسباب الجذرية. • وكيل المعالجة (Remediation agent). يقترح إجراءات قابلة للتراجع وينتظر موافقتك. • وكيل تحليل ما بعد الحادثة (Post-mortem agent). يصيغ الجداول الزمنية وبنود العمل لتتمكن من مراجعتها وتعديلها.
يتولى كل وكيل مهمة واحدة محددة. يتبادلون البيانات المهيكلة فيما بينهم، ويوفر هذا الهيكل ثلاث فوائد:
- سياق محدود (Bounded context). يرى الوكلاء فقط البيانات التي يحتاجونها، مما يحافظ على جودة عالية.
- فواصل قابلة للفحص (Inspectable seams). يمكنك رؤية ما قرره أي وكيل بدقة.
- التدخل البشري (Human takeover). يمكنك التدخل في أي لحظة ومواصلة العمل.
احذر من خطأين شائعين.
أولاً، تجنب الوكلاء "كثيري الكلام" (chatty agents). لا تسمح للوكلاء بالتواصل عبر سجل دردشة مشترك. استخدم مخرجات محددة النوع (typed artifacts) لمنع حدوث حلقات مفرغة أو معلومات قديمة.
ثانياً، حدد الصلاحيات. لا تمنح كل وكيل نفس بيانات الاعتماد. قم بتقييد ما يمكن لكل وكيل القيام به لمنع حدوث الأخطاء.
إذا كنت ترغب في البدء، فابدأ بوكيل الربط (correlation agent). فهو للقراءة فقط ومخاطره منخفضة. وبمجرد نجاح ذلك، أضف وكيل التحقيق. ثم أضف وكيل الكشف. وأخيراً أضف وكيل المعالجة.
ابنِ النظام ببطء. فأنت تريد نظاماً يمكنك الوثوق به في الساعة الثالثة فجراً.
بقلم Dr. Samson Tanimawo
المصدر: https://dev.to/samson_tanimawo/what-is-multi-agent-sre-a-practical-introduction-5ccj
مجتمع تعليمي اختياري: https://t.me/GyaanSetuAi