𝗪𝗵𝗮𝘁 𝗜𝘀 𝗠𝘂𝗹𝘁𝗶-𝗔𝗴𝗲𝗻𝘁 𝗦𝗥𝗘?
SRE टीमें AI का उपयोग करना चाहती हैं। अधिकांश टीमें इसलिए विफल हो जाती हैं क्योंकि वे AI को एक एकल उपकरण (single tool) के रूप में देखती हैं। इसके बजाय, आपको AI को एजेंटों की एक टीम के रूप में देखना चाहिए।
किसी घटना (incident) के समाधान के लिए एक बड़े मॉडल का उपयोग करना प्रोडक्शन में विफल रहता है। इसके विफल होने के तीन कारण हैं।
- कॉन्टेक्स्ट सीमाएं (Context limits)। वास्तविक घटनाओं में एक प्रॉम्प्ट के लिए बहुत अधिक डेटा होता है।
- विशेषज्ञता की कमी। डिटेक्शन (Detection), ट्राइएज (triage) और रेमेडिएशन (remediation) अलग-अलग कार्य हैं। एक प्रॉम्प्ट इन तीनों को अच्छी तरह से नहीं कर सकता।
- भरोसे की समस्या। आप एक एकल अपारदर्शी (opaque) मॉडल का ऑडिट नहीं कर सकते। आप इसे रोक नहीं सकते या इसके काम के कुछ हिस्सों को किसी इंसान को नहीं सौंप सकते।
एक मल्टी-एजेंट सिस्टम घटना के जीवनचक्र (incident lifecycle) को विशेषज्ञों में विभाजित कर देता है।
• डिटेक्शन एजेंट (Detection agent)। संकेतों (signals) पर नज़र रखता है और घटनाओं की पहचान करता है। • कोरिलेशन एजेंट (Correlation agent)। संबंधित अलर्ट्स को समूहित करता है और शोर (noise) को हटाता है। • इन्वेस्टिगेशन एजेंट (Investigation agent)। मूल कारणों (root causes) का पता लगाने के लिए लॉग्स और ट्रेसेस की जांच करता है। • रेमेडिएशन एजेंट (Remediation agent)। परिवर्तनीय (reversible) कार्यों का प्रस्ताव देता है और आपकी स्वीकृति की प्रतीक्षा करता है। • पोस्ट-मॉर्टम एजेंट (Post-mortem agent)। आपके संपादन के लिए टाइमलाइन और एक्शन आइटम्स का ड्राफ्ट तैयार करता है।
प्रत्येक एजेंट एक विशिष्ट कार्य का स्वामी होता है। वे एक-दूसरे को स्ट्रक्चर्ड डेटा पास करते हैं। यह संरचना तीन लाभ प्रदान करती है।
- सीमित कॉन्टेक्स्ट (Bounded context)। एजेंट केवल वही डेटा देखते हैं जिसकी उन्हें आवश्यकता होती है। इससे गुणवत्ता उच्च बनी रहती है।
- निरीक्षण योग्य इंटरफेस (Inspectable seams)। आप देख सकते हैं कि किसी भी एजेंट ने वास्तव में क्या निर्णय लिया है।
- मानवीय नियंत्रण (Human takeover)। आप किसी भी बिंदु पर हस्तक्षेप कर सकते हैं और काम जारी रख सकते हैं।
दो सामान्य गलतियों से सावधान रहें।
पहला, अत्यधिक बातचीत करने वाले (chatty) एजेंटों से बचें। एजेंटों को साझा चैट इतिहास के माध्यम से बात न करने दें। लूप और पुरानी जानकारी (stale information) को रोकने के लिए 'टाइप्ड आर्टिफैक्ट्स' (typed artifacts) का उपयोग करें।
दूसरा, अनुमतियों (permissions) को सीमित करें। प्रत्येक एजेंट को एक ही क्रेडेंशियल न दें। त्रुटियों को रोकने के लिए प्रत्येक एजेंट की क्षमताओं को सीमित करें।
यदि आप शुरुआत करना चाहते हैं, तो कोरिलेशन एजेंट से शुरू करें। यह केवल पढ़ने योग्य (read-only) है और इसमें जोखिम कम है। एक बार जब यह काम करने लगे, तो इन्वेस्टिगेशन जोड़ें। इसके बाद डिटेक्शन जोड़ें। अंत में रेमेडिएशन जोड़ें।
धीरे-धीरे निर्माण करें। आप एक ऐसा सिस्टम चाहते हैं जिस पर आप रात के 3 बजे भी भरोसा कर सकें।
डॉ. सैमसन तनिमावो द्वारा लिखित
स्रोत: https://dev.to/samson_tanimawo/what-is-multi-agent-sre-a-practical-introduction-5ccj
वैकल्पिक लर्निंग कम्युनिटी: https://t.me/GyaanSetuAi