ఒక ఉమ్మడి రికార్డు లేకపోతే AI ఇన్సిడెంట్ మేనేజ్మెంట్ విఫలమవుతుంది
AI ఏజెంట్లు ఇన్సిడెంట్ రెస్పాన్స్ (incident response) రంగంలోకి ప్రవేశిస్తున్నాయి.
LangChain, PagerDuty, మరియు New Relic వంటి కంపెనీలు SRE ఏజెంట్లను నిర్మిస్తున్నాయి. ఈ సాధనాలు ట్రేస్లను (traces) చదవగలవు, లాగ్లను (logs) సేకరించగలవు మరియు అప్డేట్లను డ్రాఫ్ట్ చేయగలవు. ఇవి వేగంగా పనిచేస్తాయి. ఇవి అద్భుతమైన సందర్భోచిత సమాచారాన్ని (context) అందిస్తాయి.
కానీ ఇక్కడ ఒక ఉచ్చు ఉంది.
చాలా బృందాలు AI కాంటెక్స్ట్ను ఒక వ్యక్తిగత నోట్బుక్లా (private scratchpad) భావిస్తాయి. మూల కారణాన్ని (root cause) కనుగొనడం వంటి ఉపశమన పనుల (mitigation work) కోసం వారు AIని ఉపయోగిస్తారు. కానీ సమన్వయ పనులను (coordination work) వారు మర్చిపోతారు.
ఇన్సిడెంట్ మేనేజ్మెంట్ అంటే కేవలం కారణాన్ని కనుగొనడం మాత్రమే కాదు. అది సమన్వయం గురించి కూడా. ప్రజలు ఈ క్రింది విషయాలపై ఏకీభవించేలా చేయడం దాని ముఖ్య ఉద్దేశ్యం:
- ఏమి జరిగింది.
- ఏమి మారింది.
- మీరు దేనిని తోసిపుచ్చారు.
- తదుపరి దశకు ఎవరు బాధ్యత వహిస్తారు.
- వ్యాపారానికి (business) ఏమి తెలియాలి.
ఈ సమాచారం ఒక వ్యక్తిగత చాట్ లేదా ఏజెంట్ నోట్స్లో ఉండిపోతే, ప్రక్రియ విఫలమవుతుంది.
ఉపయోగకరమైన AI ఇన్సిడెంట్ రికార్డు అనేది కేవలం చాట్ లాగ్ కాదు. అది ఒక నిర్మాణాత్మకమైన ఆపరేషనల్ ఆబ్జెక్ట్ (structured operational object). అందులో ఇవి ఉండాలి:
- ట్రిగ్గర్ (అలర్ట్, సర్వీస్, తీవ్రత).
- ఆధారాలు (ట్రేస్లు, లాగ్లు, మెట్రిక్స్, ఇటీవలి డిప్లాయ్లు).
- ఊహలు/హైపోథెసిస్ (ఏమి జరుగుతోందని మీరు అనుకుంటున్నారు మరియు ఎందుకు).
- తోసిపుచ్చిన సిద్ధాంతాలు (ఏది కారణం కాదని మీరు నిరూపించారు).
- నిర్ణయాలు మరియు ఆమోదాలు (మీరు ఎందుకు రోల్బ్యాక్ చేయాలని లేదా వేచి ఉండాలని నిర్ణయించుకున్నారు).
ఈ నిర్మాణం ఒక సాధారణ AI వైఫల్యాన్ని నివారిస్తుంది. ఒక ఏజెంట్ 'గ్రావిటీ వెల్' (gravity well) లాగా మారవచ్చు. అది ఒక సాధ్యమయ్యే కారణాన్ని కనుగొని, దానికే అతుక్కుపోతుంది. ఆ తర్వాత, ఆ ఒక్క సిద్ధాంతాన్ని సమర్థించడానికి అది వచ్చే కొత్త డేటాను కూడా అదే విధంగా విశ్లేషిస్తుంది.
ఒక ఉమ్మడి, నిర్మాణాత్మక రికార్డు బృందాన్ని వ్యతిరేక ఆధారాలను (disconfirming evidence) పరిశీలించేలా చేస్తుంది. ఇది ఏజెంట్ యొక్క పక్షపాతాన్ని (bias) నియంత్రణలో ఉంచుతుంది.
రెస్పాండర్లకు (Responders) అదనపు గందరగోళం (noise) అవసరం లేదు. వారికి ఒక ఉమ్మడి స్థితి (shared state) అవసరం. ఒక కొత్త వ్యక్తి ఇన్సిడెంట్లో చేరినప్పుడు, వారు Slackలో ఐదు నిమిషాల పాటు వెతకాల్సిన అవసరం ఉండకూడదు. వారు ప్రస్తుత హైపోథెసిస్, ఆధారాలు మరియు పెండింగ్లో ఉన్న చర్యలను వెంటనే చూడగలిగేలా ఉండాలి.
లక్ష్యం మెరిసే డెమోతో కూడిన స్వయంప్రతిపత్తి కలిగిన రెస్పాండర్ కాదు. లక్ష్యం సంస్థాగత జ్ఞానాన్ని (institutional knowledge) అందించే ఒక సాధనం.
అత్యంత తెలివైన మోడల్ కోసం వెతకడం ఆపండి. ఒక నిర్మాణాత్మక రికార్డును నిర్మించడం ప్రారంభించండి.
- ఇన్సిడెంట్ల కోసం స్పష్టమైన ఫీల్డ్లను నిర్వచించండి.
- ఏజెంట్లు ఈ రికార్డును సురక్షితంగా చదవడానికి మరియు రాయడానికి అనుమతించండి.
- రికార్డు కేవలం డేటాను మాత్రమే కాకుండా, నిర్ణయాలను కూడా నమోదు చేసేలా చూసుకోండి.
- ఇన్సిడెంట్ గందరగోళాన్ని తిరిగి ఉపయోగించదగిన జ్ఞానంగా మార్చడానికి ఈ రికార్డును ఉపయోగించండి.
మానవ బృందం ఒకే విధంగా పనిచేసేలా చేసేదే అత్యుత్తమ AI సాధనం.
Optional learning community: https://t.me/GyaanSetuAi
