सामायिक रेकॉर्डशिवाय AI इन्सिडेंट मॅनेजमेंट कोलमडते

AI एजंट्स आता इन्सिडेंट रिस्पॉन्स (incident response) क्षेत्रात प्रवेश करत आहेत.

LangChain, PagerDuty आणि New Relic सारख्या कंपन्या SRE एजंट्स तयार करत आहेत. ही साधने traces वाचू शकतात, logs काढू शकतात आणि अपडेट्सचा मसुदा तयार करू शकतात. ती वेगाने काम करतात आणि उत्तम संदर्भ (context) प्रदान करतात.

पण यात एक सापळा आहे.

अनेक टीम्स AI संदर्भ (context) एका खाजगी स्क्रॅचपॅडप्रमाणे वापरतात. ते मूळ कारण (root cause) शोधण्यासारख्या निवारण (mitigation) कामांसाठी AI चा वापर करतात, परंतु समन्वयाचे (coordination) काम विसरतात.

इन्सिडेंट मॅनेजमेंट म्हणजे केवळ कारण शोधणे नव्हे. ते समन्वयाबद्दल आहे. त्यामध्ये खालील गोष्टींवर लोकांचे एकमत करून घेणे समाविष्ट असते:

  • काय घडले.
  • काय बदलले.
  • तुम्ही काय नाकारले (काय शक्यता नाही हे ठरवले).
  • पुढची पायरी कोणाची जबाबदारी आहे.
  • व्यवसायाला काय जाणून घेणे आवश्यक आहे.

जर ही माहिती खाजगी चॅटमध्ये किंवा एजंटच्या नोट्समध्ये राहिली, तर ही प्रक्रिया अपयशी ठरते.

एक उपयुक्त AI इन्सिडेंट रेकॉर्ड म्हणजे केवळ चॅट लॉग नसून तो एक स्ट्रक्चर्ड ऑपरेशनल ऑब्जेक्ट (structured operational object) असावा. त्यामध्ये खालील गोष्टींचा समावेश असणे आवश्यक आहे:

  • ट्रिगर (alert, service, severity).
  • पुरावे (traces, logs, metrics, अलीकडील deploys).
  • गृहितके (काय घडत आहे असे तुम्हाला वाटते आणि का).
  • नाकारलेले सिद्धांत (काय कारण नाही हे तुम्ही कसे सिद्ध केले).
  • निर्णय आणि मंजुरी (तुम्ही रोल बॅक करण्याचा किंवा थांबण्याचा निर्णय का घेतला).

ही रचना AI च्या एका सामान्य त्रुटीला रोखते. एखादा एजंट 'ग्रॅव्हिटी वेल' (gravity well) बनू शकतो. तो एक संभाव्य कारण शोधतो आणि त्यावरच अडकून पडतो. त्यानंतर तो त्या एका सिद्धांताला पुष्टी देण्यासाठी सर्व नवीन डेटाचा चुकीचा अर्थ लावतो.

एक सामायिक, स्ट्रक्चर्ड रेकॉर्ड टीमला विरोधी पुराव्यांकडे पाहण्यास भाग पाडते. यामुळे एजंटचा पूर्वग्रह (bias) नियंत्रणात राहतो.

रिस्पॉन्सर्सना (Responders) अधिक गोंधळाची (noise) गरज नाही. त्यांना एका सामायिक स्थितीची (shared state) गरज आहे. जेव्हा एखादी नवीन व्यक्ती इन्सिडेंटमध्ये सामील होते, तेव्हा त्यांनी Slack मध्ये शोधण्यात पाच मिनिटे घालवू नयेत. त्यांना सध्याचे गृहितक, पुरावे आणि प्रलंबित कृती त्वरित दिसल्या पाहिजेत.

ध्येय एखादे भपकेबाज डेमो असलेले स्वायत्त रिस्पॉन्डर (autonomous responder) तयार करणे हे नाही. ध्येय असे साधन तयार करणे आहे जे संस्थात्मक ज्ञान (institutional knowledge) मागे ठेवेल.

सर्वात हुशार मॉडेल शोधणे थांबवा. एक स्ट्रक्चर्ड रेकॉर्ड तयार करण्यास सुरुवात करा.

  • इन्सिडेंट्ससाठी स्पष्ट फील्ड्स (fields) निश्चित करा.
  • एजंट्सना या रेकॉर्डमध्ये सुरक्षितपणे वाचू आणि लिहू द्या.
  • रेकॉर्डमध्ये केवळ डेटा नाही, तर निर्णय देखील नोंदवले जातील याची खात्री करा.
  • इन्सिडेंटमधील गोंधळाचे रूपांतर पुन्हा वापरण्यायोग्य ज्ञानात करण्यासाठी या रेकॉर्डचा वापर करा.

सर्वोत्तम AI साधन ते आहे जे मानवी टीमला एकसंधपणे काम करण्यास सक्षम करते.

Source: https://dev.to/focused_dot_io/ai-incident-management-breaks-without-a-shared-record-focused-labs-1og5

Optional learning community: https://t.me/GyaanSetuAi