మల్టీ-ఏజెంట్ SRE అంటే ఏమిటి?
SRE బృందాలు AIని ఉపయోగించాలని అనుకుంటాయి. చాలా బృందాలు AIని ఒకే ఒక సాధనంగా (single tool) పరిగణించడం వల్ల విఫలమవుతాయి. దానికి బదులుగా, మీరు AIని ఏజెంట్ల బృందంగా పరిగణించాలి.
ఒక పెద్ద మోడల్ను నేరుగా ఒక ఇన్సిడెంట్ (incident) పరిష్కారం కోసం ఉపయోగించడం ప్రొడక్షన్లో విఫలమవుతుంది. దీనికి మూడు కారణాలు ఉన్నాయి.
- కాంటెక్స్ట్ పరిమితులు (Context limits). నిజమైన ఇన్సిడెంట్లలో ఒకే ప్రాంప్ట్ (prompt) కి సరిపోనంత ఎక్కువ డేటా ఉంటుంది.
- స్పెషలైజేషన్ లేకపోవడం (Lack of specialization). డిటెక్షన్ (Detection), ట్రైయాజ్ (triage), మరియు రిమీడియేషన్ (remediation) అనేవి వేర్వేరు పనులు. ఒకే ప్రాంప్ట్ ఈ మూడింటినీ సమర్థవంతంగా చేయలేదు.
- నమ్మకమైన సమస్యలు (Trust issues). ఒకే ఒక అస్పష్టమైన (opaque) మోడల్ను మీరు ఆడిట్ చేయలేరు. దానిని ఆపలేరు లేదా దాని పనిలోని కొన్ని భాగాలను మనిషికి అప్పగించలేరు.
మల్టీ-ఏజెంట్ సిస్టమ్ ఇన్సిడెంట్ లైఫ్ సైకిల్ను స్పెషలిస్టులుగా విభజిస్తుంది.
• Detection agent. సిగ్నల్స్ను గమనిస్తుంది మరియు ఇన్సిడెంట్లను గుర్తిస్తుంది. • Correlation agent. సంబంధిత అలర్ట్లను సమూహపరచడం మరియు అనవసరమైన సమాచారాన్ని (noise) తొలగించడం చేస్తుంది. • Investigation agent. మూల కారణాలను (root causes) కనుగొనడానికి లాగ్లు (logs) మరియు ట్రేస్లను (traces) తనిఖీ చేస్తుంది. • Remediation agent. వెనక్కి తీసుకోవడానికి వీలైన చర్యలను (reversible actions) ప్రతిపాదిస్తుంది మరియు మీ ఆమోదం కోసం వేచి ఉంటుంది. • Post-mortem agent. మీరు సవరించడానికి వీలుగా టైమ్లైన్లు మరియు యాక్షన్ ఐటమ్స్ను సిద్ధం చేస్తుంది.
ప్రతి ఏజెంట్ ఒక నిర్దిష్టమైన పనిని మాత్రమే చేస్తుంది. అవి ఒకదానికొకటి స్ట్రక్చర్డ్ డేటాను (structured data) పంపుతాయి. ఈ నిర్మాణం మూడు ప్రయోజనాలను అందిస్తుంది.
- పరిమిత కాంటెక్స్ట్ (Bounded context). ఏజెంట్లు తమకు అవసరమైన డేటాను మాత్రమే చూస్తాయి. ఇది నాణ్యతను పెంచుతుంది.
- తనిఖీ చేయదగిన విభజనలు (Inspectable seams). ఏ ఏజెంట్ ఏమి నిర్ణయించిందో మీరు ఖచ్చితంగా చూడవచ్చు.
- మానవ జోక్యం (Human takeover). మీరు ఏ సమయంలోనైనా జోక్యం చేసుకుని పనిని కొనసాగించవచ్చు.
రెండు సాధారణ తప్పుల పట్ల జాగ్రత్తగా ఉండండి.
మొదటిది, 'చాటీ' (chatty) ఏజెంట్లను నివారించండి. ఏజెంట్లు ఒకే షేర్డ్ చాట్ హిస్టరీ ద్వారా మాట్లాడుకోనివ్వకండి. లూప్లు మరియు పాత సమాచారాన్ని (stale information) నివారించడానికి టైప్డ్ ఆర్టిఫాక్ట్లను (typed artifacts) ఉపయోగించండి.
రెండవది, అనుమతులను (permissions) పరిమితం చేయండి. ప్రతి ఏజెంట్కు ఒకే విధమైన క్రెడెన్షియల్స్ (credentials) ఇవ్వకండి. తప్పులను నివారించడానికి ప్రతి ఏజెంట్ ఏమి చేయగలదో పరిమితం చేయండి.
మీరు ప్రారంభించాలనుకుంటే, కోరిలేషన్ ఏజెంట్తో మొదలుపెట్టండి. ఇది కేవలం చదవడానికి మాత్రమే (read-only) మరియు తక్కువ రిస్క్ కలిగి ఉంటుంది. అది విజయవంతమైన తర్వాత, ఇన్వెస్టిగేషన్ను జోడించండి. ఆ తర్వాత డిటెక్షన్ను జోడించండి. చివరగా రిమీడియేషన్ను జోడించండి.
నెమ్మదిగా నిర్మించండి. మీరు అర్థరాత్రి 3 గంటల సమయంలో కూడా నమ్మగలిగే వ్యవస్థను కోరుకుంటారు.
డాక్టర్ సామ్సన్ తనిమావో రాసినది
Source: https://dev.to/samson_tanimawo/what-is-multi-agent-sre-a-practical-introduction-5ccj
Optional learning community: https://t.me/GyaanSetuAi