શેર કરેલ રેકોર્ડ વગર AI ઇન્સિડન્ટ મેનેજમેન્ટ નિષ્ફળ જાય છે
AI એજન્ટ્સ ઇન્સિડન્ટ રિસ્પોન્સ ક્ષેત્રમાં પ્રવેશ કરી રહ્યા છે.
LangChain, PagerDuty અને New Relic જેવી કંપનીઓ SRE એજન્ટ્સ બનાવી રહી છે. આ સાધનો ટ્રેસ (traces) વાંચી શકે છે, લોગ્સ (logs) મેળવી શકે છે અને અપડેટ્સ ડ્રાફ્ટ કરી શકે છે. તેઓ ઝડપથી કામ કરે છે. તેઓ ઉત્તમ સંદર્ભ (context) પૂરો પાડે છે.
પરંતુ તેમાં એક છટકું છે.
ઘણી ટીમો AI સંદર્ભને ખાનગી સ્ક્રૅચપેડ તરીકે જુએ છે. તેઓ મૂળ કારણ (root cause) શોધવા જેવા નિવારણના કામ માટે AI નો ઉપયોગ કરે છે. તેઓ સંકલન (coordination) ના કામ વિશે ભૂલી જાય છે.
ઇન્સિડન્ટ મેનેજમેન્ટ માત્ર કારણ શોધવા વિશે નથી. તે સંકલન વિશે છે. તે લોકોને નીચેની બાબતો પર સહમત કરવા વિશે છે:
- શું થયું.
- શું બદલાયું.
- તમે કઈ બાબતોને નકારી કાઢી છે.
- આગલું પગલું કોણ લેશે.
- બિઝનેસને શું જાણવાની જરૂર છે.
જો આ માહિતી ખાનગી ચેટ અથવા એજન્ટની નોંધોમાં જ રહી જાય, તો પ્રક્રિયા નિષ્ફળ જાય છે.
એક ઉપયોગી AI ઇન્સિડન્ટ રેકોર્ડ એ ચેટ લોગ નથી. તે એક સ્ટ્રક્ચર્ડ ઓપરેશનલ ઓબ્જેક્ટ છે. તેમાં નીચેની બાબતોનો સમાવેશ થવો જોઈએ:
- ટ્રિગર (alert, service, severity).
- પુરાવા (traces, logs, metrics, recent deploys).
- પરિકલ્પનાઓ (તમને શું લાગે છે કે શું થઈ રહ્યું છે અને શા માટે).
- નકારવામાં આવેલી થિયરીઓ (તમે શું સાબિત કર્યું કે તે કારણ નથી).
- નિર્ણયો અને મંજૂરીઓ (તમે રોલબેક કરવાનું કે રાહ જોવાનું શા માટે પસંદ કર્યું).
આ માળખું AI ની એક સામાન્ય નિષ્ફળતાને અટકાવે છે. એક એજન્ટ 'ગ્રેવિટી વેલ' (gravity well) બની શકે છે. તે એક સંભવિત કારણ શોધે છે અને તેના પર જ અટકી જાય છે. ત્યારબાદ તે તે એક જ થિયરીને ટેકો આપવા માટે તમામ નવા ડેટાનું અર્થઘટન કરે છે.
એક શેર કરેલ, સ્ટ્રક્ચર્ડ રેકોર્ડ ટીમને વિરોધાભાસી પુરાવાઓ જોવા માટે મજબૂર કરે છે. તે એજન્ટના પૂર્વગ્રહને નિયંત્રણમાં રાખે છે.
રિસ્પોન્ડર્સને વધુ અવાજ (noise) ની જરૂર નથી. તેમને શેર કરેલી સ્થિતિ (shared state) ની જરૂર છે. જ્યારે કોઈ નવો વ્યક્તિ ઇન્સિડન્ટમાં જોડાય, ત્યારે તેણે Slack માં શોધવામાં પાંચ મિનિટ ન બગાડવી જોઈએ. તેણે વર્તમાન પરિકલ્પના, પુરાવા અને પેન્ડિંગ એક્શન તરત જ જોઈ લેવી જોઈએ.
ધ્યેય આકર્ષક ડેમો સાથેનો સ્વાયત્ત રિસ્પોન્ડર નથી. ધ્યેય એવું સાધન છે જે સંસ્થાકીય જ્ઞાન (institutional knowledge) છોડી જાય.
સૌથી ચતુર મોડલ શોધવાનું બંધ કરો. એક સ્ટ્રક્ચર્ડ રેકોર્ડ બનાવવાનું શરૂ કરો.
- ઇન્સિડન્ટ્સ માટે સ્પષ્ટ ફીલ્ડ્સ વ્યાખ્યાયિત કરો.
- એજન્ટ્સને આ રેકોર્ડમાં સુરક્ષિત રીતે વાંચવા અને લખવા દો.
- ખાતરી કરો કે રેકોર્ડ માત્ર ડેટા જ નહીં, પણ નિર્ણયો પણ કેપ્ચર કરે છે.
- ઇન્સિડન્ટની અરાજકતાને ફરીથી ઉપયોગમાં લઈ શકાય તેવા જ્ઞાનમાં બદલવા માટે રેકોર્ડનો ઉપયોગ કરો.
શ્રેષ્ઠ AI સાધન એ છે જે માનવ ટીમને એક તરીકે કામ કરવા માટે સક્ષમ બનાવે છે.
Optional learning community: https://t.me/GyaanSetuAi
