AI Incident Management Breaks Without A Shared Record

Translated for your language. Read the original.

AI-assisted draft.

GyaanSetu Editorialகடந்த வாரம்2min read

AI Incident Management Breaks Without A Shared Record

பகிரப்பட்ட பதிவு இல்லையென்றால் AI Incident Management முடங்கிவிடும்

AI ஏஜெண்டுகள் incident response துறையில் நுழைகின்றன.

LangChain, PagerDuty மற்றும் New Relic போன்ற நிறுவனங்கள் SRE ஏஜெண்டுகளை உருவாக்கி வருகின்றன. இந்தத் கருவிகளால் traces-களைப் படிக்கவும், logs-களை எடுக்கவும் மற்றும் updates-களைத் தயார் செய்யவும் முடியும். இவை வேகமாகச் செயல்படுகின்றன. இவை சிறந்த சூழலை (context) வழங்குகின்றன.

ஆனால் இதில் ஒரு சிக்கல் உள்ளது.

பல குழுக்கள் AI context-ஐ ஒரு தனிப்பட்ட குறிப்பேடாக (private scratchpad) கருதுகின்றன. மூல காரணத்தைக் (root cause) கண்டறிவது போன்ற தணிப்புப் பணிகளுக்கு (mitigation work) அவர்கள் AI-ஐப் பயன்படுத்துகின்றனர். ஆனால் ஒருங்கிணைப்புப் பணிகளை (coordination work) அவர்கள் மறந்துவிடுகிறார்கள்.

Incident management என்பது ஒரு காரணத்தைக் கண்டறிவது மட்டுமல்ல. அது ஒருங்கிணைப்பைப் பற்றியது. பின்வருவனவற்றில் மக்கள் உடன்படச் செய்வதைப் பற்றியது:

என்ன நடந்தது.
என்ன மாறியது.
நீங்கள் எதைத் தவிர்த்தீர்கள்.
அடுத்த கட்டத்திற்குப் பொறுப்பானவர் யார்.
வணிகத்திற்குத் தெரிய வேண்டிய விஷயம் என்ன.

இந்தத் தகவல் ஒரு தனிப்பட்ட சாட் (private chat) அல்லது ஏஜெண்டின் குறிப்புகளில் மட்டும் இருந்தால், அந்தச் செயல்முறை தோல்வியடையும்.

பயனுள்ள ஒரு AI incident record என்பது வெறும் சாட் லாக் (chat log) அல்ல. அது ஒரு கட்டமைக்கப்பட்ட செயல்பாட்டுப் பொருள் (structured operational object). அதில் பின்வருவன அடங்கியிருக்க வேண்டும்:

தூண்டுதல் (trigger) (alert, service, severity).
சான்றுகள் (evidence) (traces, logs, metrics, recent deploys).
கருதுகோள்கள் (hypotheses) (என்ன நடப்பதாக நீங்கள் நினைக்கிறீர்கள் மற்றும் ஏன்).
நிராகரிக்கப்பட்ட கோட்பாடுகள் (rejected theories) (எது காரணமாக இருக்க முடியாது என்று நீங்கள் நிரூபித்தீர்கள்).
முடிவுகள் மற்றும் ஒப்புதல்கள் (decisions and approvals) (ஏன் நீங்கள் roll back செய்ய அல்லது காத்திருக்கத் தேர்ந்தெடுத்தீர்கள்).

இந்த அமைப்பு ஒரு பொதுவான AI தோல்வியைத் தடுக்கிறது. ஒரு ஏஜெண்ட் ஒரு ஈர்ப்பு மையமாக (gravity well) மாறிவிடக்கூடும். அது ஒரு சாத்தியமான காரணத்தைக் கண்டறிந்து, அதில் முடங்கிவிடும். பின்னர் அது அந்த ஒரு கோட்பாட்டை ஆதரிப்பதற்காக அனைத்துப் புதிய தரவுகளையும் தவறாகப் புரிந்துகொள்ளும்.

பகிரப்பட்ட, கட்டமைக்கப்பட்ட பதிவு, குழுவை முரண்பட்ட சான்றுகளைப் பார்க்கத் தூண்டுகிறது. இது ஏஜெண்டின் சார்புநிலையை (bias) கட்டுக்குள் வைக்கிறது.

பதிலளிப்பவர்களுக்கு (Responders) கூடுதல் இரைச்சல் தேவையில்லை. அவர்களுக்கு ஒரு பகிரப்பட்ட நிலை (shared state) தேவை. ஒரு புதிய நபர் ஒரு incident-இல் இணையும்போது, அவர் Slack-இல் தேடித் தேடி ஐந்து நிமிடங்கள் செலவிடக் கூடாது. அவர் தற்போதைய கருதுகோள், சான்றுகள் மற்றும் நிலுவையில் உள்ள நடவடிக்கைகள் ஆகியவற்றை உடனடியாகப் பார்க்க வேண்டும்.

இலக்கு என்பது ஒரு பகட்டான டெமோவுடன் கூடிய தன்னாட்சி பதிலளிப்பாளர் (autonomous responder) அல்ல. இலக்கு என்பது நிறுவன அறிவு (institutional knowledge) மிஞ்சியிருக்கும் ஒரு கருவியாகும்.

மிகவும் புத்திசாலித்தனமான மாடலைத் தேடுவதை நிறுத்துங்கள். ஒரு கட்டமைக்கப்பட்ட பதிவை உருவாக்கத் தொடங்குங்கள்.

Incident-களுக்குத் தெளிவான புலங்களை (fields) வரையறுக்கவும்.
ஏஜெண்டுகள் இந்தத் பதிவைப் பாதுகாப்பாகப் படிக்கவும் எழுதவும் அனுமதிக்கவும்.
பதிவு என்பது தரவுகளை மட்டுமல்லாமல், முடிவுகளையும் பதிவு செய்வதை உறுதி செய்யவும்.
Incident குழப்பத்தை மீண்டும் பயன்படுத்தக்கூடிய அறிவாக மாற்ற அந்தப் பதிவைப் பயன்படுத்தவும்.

சிறந்த AI கருவி என்பது மனிதக் குழுவை ஒன்றாகச் செயல்பட வைப்பதாகும்.

Source: https://dev.to/focused_dot_io/ai-incident-management-breaks-without-a-shared-record-focused-labs-1og5

Optional learning community: https://t.me/GyaanSetuAi

AI Incident Management Breaks Without A Shared Record

Continue reading

𝗔𝗜 𝗔𝗴𝗲𝗻𝘁𝘀 𝗛𝗮𝘃𝗲 𝗔 𝗥𝗲𝗹𝗶𝗮𝗯𝗶𝗹𝗶𝘁𝘆 𝗣𝗿𝗼𝗯𝗹𝗲𝗺

AI ஏஜெண்டுகளைத் தயாரிப்பில் இயக்கும்போது நான் கற்றுக்கொண்டவை

உங்கள் லாக்ஸ்களை (logs) சேமிக்காத ஒரு AI இன்சிடென்ட் கோபைலட்டை (Incident Copilot) நான் உருவாக்கினேன்