பகிரப்பட்ட பதிவு இல்லையென்றால் AI Incident Management முடங்கிவிடும்

AI ஏஜெண்டுகள் incident response துறையில் நுழைகின்றன.

LangChain, PagerDuty மற்றும் New Relic போன்ற நிறுவனங்கள் SRE ஏஜெண்டுகளை உருவாக்கி வருகின்றன. இந்தத் கருவிகளால் traces-களைப் படிக்கவும், logs-களை எடுக்கவும் மற்றும் updates-களைத் தயார் செய்யவும் முடியும். இவை வேகமாகச் செயல்படுகின்றன. இவை சிறந்த சூழலை (context) வழங்குகின்றன.

ஆனால் இதில் ஒரு சிக்கல் உள்ளது.

பல குழுக்கள் AI context-ஐ ஒரு தனிப்பட்ட குறிப்பேடாக (private scratchpad) கருதுகின்றன. மூல காரணத்தைக் (root cause) கண்டறிவது போன்ற தணிப்புப் பணிகளுக்கு (mitigation work) அவர்கள் AI-ஐப் பயன்படுத்துகின்றனர். ஆனால் ஒருங்கிணைப்புப் பணிகளை (coordination work) அவர்கள் மறந்துவிடுகிறார்கள்.

Incident management என்பது ஒரு காரணத்தைக் கண்டறிவது மட்டுமல்ல. அது ஒருங்கிணைப்பைப் பற்றியது. பின்வருவனவற்றில் மக்கள் உடன்படச் செய்வதைப் பற்றியது:

  • என்ன நடந்தது.
  • என்ன மாறியது.
  • நீங்கள் எதைத் தவிர்த்தீர்கள்.
  • அடுத்த கட்டத்திற்குப் பொறுப்பானவர் யார்.
  • வணிகத்திற்குத் தெரிய வேண்டிய விஷயம் என்ன.

இந்தத் தகவல் ஒரு தனிப்பட்ட சாட் (private chat) அல்லது ஏஜெண்டின் குறிப்புகளில் மட்டும் இருந்தால், அந்தச் செயல்முறை தோல்வியடையும்.

பயனுள்ள ஒரு AI incident record என்பது வெறும் சாட் லாக் (chat log) அல்ல. அது ஒரு கட்டமைக்கப்பட்ட செயல்பாட்டுப் பொருள் (structured operational object). அதில் பின்வருவன அடங்கியிருக்க வேண்டும்:

  • தூண்டுதல் (trigger) (alert, service, severity).
  • சான்றுகள் (evidence) (traces, logs, metrics, recent deploys).
  • கருதுகோள்கள் (hypotheses) (என்ன நடப்பதாக நீங்கள் நினைக்கிறீர்கள் மற்றும் ஏன்).
  • நிராகரிக்கப்பட்ட கோட்பாடுகள் (rejected theories) (எது காரணமாக இருக்க முடியாது என்று நீங்கள் நிரூபித்தீர்கள்).
  • முடிவுகள் மற்றும் ஒப்புதல்கள் (decisions and approvals) (ஏன் நீங்கள் roll back செய்ய அல்லது காத்திருக்கத் தேர்ந்தெடுத்தீர்கள்).

இந்த அமைப்பு ஒரு பொதுவான AI தோல்வியைத் தடுக்கிறது. ஒரு ஏஜெண்ட் ஒரு ஈர்ப்பு மையமாக (gravity well) மாறிவிடக்கூடும். அது ஒரு சாத்தியமான காரணத்தைக் கண்டறிந்து, அதில் முடங்கிவிடும். பின்னர் அது அந்த ஒரு கோட்பாட்டை ஆதரிப்பதற்காக அனைத்துப் புதிய தரவுகளையும் தவறாகப் புரிந்துகொள்ளும்.

பகிரப்பட்ட, கட்டமைக்கப்பட்ட பதிவு, குழுவை முரண்பட்ட சான்றுகளைப் பார்க்கத் தூண்டுகிறது. இது ஏஜெண்டின் சார்புநிலையை (bias) கட்டுக்குள் வைக்கிறது.

பதிலளிப்பவர்களுக்கு (Responders) கூடுதல் இரைச்சல் தேவையில்லை. அவர்களுக்கு ஒரு பகிரப்பட்ட நிலை (shared state) தேவை. ஒரு புதிய நபர் ஒரு incident-இல் இணையும்போது, அவர் Slack-இல் தேடித் தேடி ஐந்து நிமிடங்கள் செலவிடக் கூடாது. அவர் தற்போதைய கருதுகோள், சான்றுகள் மற்றும் நிலுவையில் உள்ள நடவடிக்கைகள் ஆகியவற்றை உடனடியாகப் பார்க்க வேண்டும்.

இலக்கு என்பது ஒரு பகட்டான டெமோவுடன் கூடிய தன்னாட்சி பதிலளிப்பாளர் (autonomous responder) அல்ல. இலக்கு என்பது நிறுவன அறிவு (institutional knowledge) மிஞ்சியிருக்கும் ஒரு கருவியாகும்.

மிகவும் புத்திசாலித்தனமான மாடலைத் தேடுவதை நிறுத்துங்கள். ஒரு கட்டமைக்கப்பட்ட பதிவை உருவாக்கத் தொடங்குங்கள்.

  • Incident-களுக்குத் தெளிவான புலங்களை (fields) வரையறுக்கவும்.
  • ஏஜெண்டுகள் இந்தத் பதிவைப் பாதுகாப்பாகப் படிக்கவும் எழுதவும் அனுமதிக்கவும்.
  • பதிவு என்பது தரவுகளை மட்டுமல்லாமல், முடிவுகளையும் பதிவு செய்வதை உறுதி செய்யவும்.
  • Incident குழப்பத்தை மீண்டும் பயன்படுத்தக்கூடிய அறிவாக மாற்ற அந்தப் பதிவைப் பயன்படுத்தவும்.

சிறந்த AI கருவி என்பது மனிதக் குழுவை ஒன்றாகச் செயல்பட வைப்பதாகும்.

Source: https://dev.to/focused_dot_io/ai-incident-management-breaks-without-a-shared-record-focused-labs-1og5

Optional learning community: https://t.me/GyaanSetuAi