ഹ്യൂമൻ-ഇൻ-ദി-ലൂപ്പ് SRE

ഓട്ടോമേഷൻ മനുഷ്യരേക്കാൾ വേഗത്തിൽ പ്രവർത്തിക്കുന്നു.

2021-ൽ, ഒരു Fastly കോൺഫിഗറേഷൻ മാറ്റം ആഗോള തകരാറിന് (outage) കാരണമായി. ഓട്ടോമേഷൻ ഒരു മിനിറ്റിൽ താഴെ സമയം കൊണ്ട് ആ പിശക് പടർത്തി. അത് പരിഹരിക്കാൻ മനുഷ്യർക്ക് 49 മിനിറ്റ് എടുത്തു.

ഇതാണ് AI-അസിസ്റ്റഡ് SRE-യുടെ പ്രധാന വെല്ലുവിളി. മനുഷ്യർക്ക് എത്തിപ്പിടിക്കാൻ കഴിയാത്ത വേഗതയിൽ പ്രശ്നങ്ങൾ കണ്ടെത്താനും പരിഹരിക്കാനും AI-ക്ക് കഴിയും. അപകടം സാങ്കേതികവിദ്യയിലല്ല. അപകടം ഓട്ടോമേറ്റഡ് പ്രവർത്തനങ്ങളും മനുഷ്യന്റെ ഉത്തരവാദിത്തവും തമ്മിലുള്ള വേഗതയിലെ വ്യത്യാസമാണ്.

ഓട്ടോമേഷൻ എവിടെ അവസാനിക്കുന്നുവെന്നും മനുഷ്യന്റെ വിവേചനാധികാരം എവിടെ തുടങ്ങുന്നുവെന്നും നിർവചിക്കാൻ നിങ്ങൾ ഒരു എസ്കലേഷൻ പോളിസി (escalation policy) രൂപകൽപ്പന ചെയ്യണം.

നിങ്ങളുടെ AI-യെ നിയന്ത്രിക്കാൻ Automation Autonomy Spectrum ഉപയോഗിക്കുക:

• Level 0 (Manual): AI സഹായം നൽകുന്നില്ല. മനുഷ്യർ എല്ലാം ചെയ്യുന്നു. • Level 1 (Assisted): AI സന്ദർഭങ്ങൾ (context) നൽകുന്നു. തീരുമാനങ്ങൾ എടുക്കുന്നത് മനുഷ്യരാണ്. • Level 2 (Supervised): AI നിർദ്ദേശങ്ങൾ നൽകുന്നു. മനുഷ്യർ ഓരോന്നും അംഗീകരിക്കണം. • Level 3 (Conditional): നിശ്ചിത നിയമങ്ങൾക്കുള്ളിൽ AI പ്രവർത്തിക്കുന്നു. മനുഷ്യർക്ക് അറിയിപ്പ് ലഭിക്കുന്നു. • Level 4 (Autonomous): AI സ്വയം പ്രവർത്തിക്കുകയും പരിശോധിക്കുകയും ചെയ്യുന്നു.

ഒരു ഓട്ടോമേഷനെ ഒരിക്കലും എന്നെന്നേക്കുമായി Level 4-ൽ വിടരുത്. സിസ്റ്റങ്ങൾ മാറിക്കൊണ്ടിരിക്കും. അടിസ്ഥാനപരമായ പ്രശ്നങ്ങളിൽ മാറ്റം വന്നാൽ, ഇന്ന് പ്രവർത്തിക്കുന്ന ഒരു ഓട്ടോമേഷൻ നാളെ അപകടകരമായേക്കാം. ഓരോ സ്വയംഭരണാധികാര പ്രവർത്തനവും (autonomous action) നിങ്ങൾ പതിവായി പരിശോധിക്കണം.

താഴെ പറയുന്ന നാല് കാരണങ്ങൾ (triggers) ഉണ്ടാകുമ്പോൾ ഓട്ടോമേഷനിൽ നിന്ന് മനുഷ്യന്റെ മേൽനോട്ടത്തിലേക്ക് മാറണം:

"AI ആണ് തീരുമാനിച്ചത്" എന്നത് നിങ്ങളുടെ ഒഴികഴിവായി മാറാൻ അനുവദിക്കരുത്. ഓരോ പ്രവർത്തനവും ഒരു മനുഷ്യനിലേക്കോ അല്ലെങ്കിൽ നേതൃത്വം അംഗീകരിച്ച ഒരു പോളിസിയിലേക്കോ ബന്ധപ്പെട്ടിരിക്കണം.

ഓട്ടോമേഷൻ തുടങ്ങുന്നതിന് മുമ്പ് നിങ്ങളുടെ പോളിസി തയ്യാറാക്കുക. നിങ്ങളുടെ AI കൃത്യമാണെന്ന് തെളിയിക്കാൻ ഡാറ്റ ഉപയോഗിക്കുക. നിങ്ങളുടെ AI ഇടയ്ക്കിടെ തെറ്റുകൾ വരുത്തുന്നുണ്ടെങ്കിൽ, അതിന്റെ സ്വയംഭരണാധികാരം (autonomy) ഉടൻ തന്നെ കുറയ്ക്കുക.

Source: https://dev.to/npayyappilly/the-human-in-the-loop-sre-designing-automation-escalation-policies-for-ai-assisted-operations-2c7f

Optional learning community: https://t.me/GyaanSetuAi