𝗧𝗵𝗲 𝗛𝘂𝗺𝗮𝗻 𝗶𝗻 𝘁𝗵𝗲 𝗟𝗼𝗼𝗽 𝗦𝗥𝗘

📅4 hours ago⏱1 min read

ഹ്യൂമൻ-ഇൻ-ദി-ലൂപ്പ് SRE

ഓട്ടോമേഷൻ മനുഷ്യരേക്കാൾ വേഗത്തിൽ പ്രവർത്തിക്കുന്നു.

2021-ൽ, ഒരു Fastly കോൺഫിഗറേഷൻ മാറ്റം ആഗോള തകരാറിന് (outage) കാരണമായി. ഓട്ടോമേഷൻ ഒരു മിനിറ്റിൽ താഴെ സമയം കൊണ്ട് ആ പിശക് പടർത്തി. അത് പരിഹരിക്കാൻ മനുഷ്യർക്ക് 49 മിനിറ്റ് എടുത്തു.

ഇതാണ് AI-അസിസ്റ്റഡ് SRE-യുടെ പ്രധാന വെല്ലുവിളി. മനുഷ്യർക്ക് എത്തിപ്പിടിക്കാൻ കഴിയാത്ത വേഗതയിൽ പ്രശ്നങ്ങൾ കണ്ടെത്താനും പരിഹരിക്കാനും AI-ക്ക് കഴിയും. അപകടം സാങ്കേതികവിദ്യയിലല്ല. അപകടം ഓട്ടോമേറ്റഡ് പ്രവർത്തനങ്ങളും മനുഷ്യന്റെ ഉത്തരവാദിത്തവും തമ്മിലുള്ള വേഗതയിലെ വ്യത്യാസമാണ്.

ഓട്ടോമേഷൻ എവിടെ അവസാനിക്കുന്നുവെന്നും മനുഷ്യന്റെ വിവേചനാധികാരം എവിടെ തുടങ്ങുന്നുവെന്നും നിർവചിക്കാൻ നിങ്ങൾ ഒരു എസ്കലേഷൻ പോളിസി (escalation policy) രൂപകൽപ്പന ചെയ്യണം.

നിങ്ങളുടെ AI-യെ നിയന്ത്രിക്കാൻ Automation Autonomy Spectrum ഉപയോഗിക്കുക:

• Level 0 (Manual): AI സഹായം നൽകുന്നില്ല. മനുഷ്യർ എല്ലാം ചെയ്യുന്നു. • Level 1 (Assisted): AI സന്ദർഭങ്ങൾ (context) നൽകുന്നു. തീരുമാനങ്ങൾ എടുക്കുന്നത് മനുഷ്യരാണ്. • Level 2 (Supervised): AI നിർദ്ദേശങ്ങൾ നൽകുന്നു. മനുഷ്യർ ഓരോന്നും അംഗീകരിക്കണം. • Level 3 (Conditional): നിശ്ചിത നിയമങ്ങൾക്കുള്ളിൽ AI പ്രവർത്തിക്കുന്നു. മനുഷ്യർക്ക് അറിയിപ്പ് ലഭിക്കുന്നു. • Level 4 (Autonomous): AI സ്വയം പ്രവർത്തിക്കുകയും പരിശോധിക്കുകയും ചെയ്യുന്നു.

ഒരു ഓട്ടോമേഷനെ ഒരിക്കലും എന്നെന്നേക്കുമായി Level 4-ൽ വിടരുത്. സിസ്റ്റങ്ങൾ മാറിക്കൊണ്ടിരിക്കും. അടിസ്ഥാനപരമായ പ്രശ്നങ്ങളിൽ മാറ്റം വന്നാൽ, ഇന്ന് പ്രവർത്തിക്കുന്ന ഒരു ഓട്ടോമേഷൻ നാളെ അപകടകരമായേക്കാം. ഓരോ സ്വയംഭരണാധികാര പ്രവർത്തനവും (autonomous action) നിങ്ങൾ പതിവായി പരിശോധിക്കണം.

താഴെ പറയുന്ന നാല് കാരണങ്ങൾ (triggers) ഉണ്ടാകുമ്പോൾ ഓട്ടോമേഷനിൽ നിന്ന് മനുഷ്യന്റെ മേൽനോട്ടത്തിലേക്ക് മാറണം:

Low Confidence: AI അതിന്റെ രോഗനിർണ്ണയത്തിൽ (diagnosis) ഉറപ്പില്ലാത്ത അവസ്ഥ.
High Blast Radius: ആ പ്രവർത്തനം ഒരുപാട് സേവനങ്ങളെയോ ഉപയോക്താക്കളെയോ ബാധിക്കുന്നു.
Novelty: പരാജയത്തിന്റെ രീതി പുതിയതും AI ഇതുവരെ കാണാത്തതുമാണ്.
Regulation: ആ പ്രവർത്തനം സംരക്ഷിക്കപ്പെട്ടതോ അല്ലെങ്കിൽ നിയമപരമായ മാനദണ്ഡങ്ങളുള്ളതോ ആയ ഒരു സിസ്റ്റത്തെ ബാധിക്കുന്നു.

"AI ആണ് തീരുമാനിച്ചത്" എന്നത് നിങ്ങളുടെ ഒഴികഴിവായി മാറാൻ അനുവദിക്കരുത്. ഓരോ പ്രവർത്തനവും ഒരു മനുഷ്യനിലേക്കോ അല്ലെങ്കിൽ നേതൃത്വം അംഗീകരിച്ച ഒരു പോളിസിയിലേക്കോ ബന്ധപ്പെട്ടിരിക്കണം.

ഓട്ടോമേഷൻ തുടങ്ങുന്നതിന് മുമ്പ് നിങ്ങളുടെ പോളിസി തയ്യാറാക്കുക. നിങ്ങളുടെ AI കൃത്യമാണെന്ന് തെളിയിക്കാൻ ഡാറ്റ ഉപയോഗിക്കുക. നിങ്ങളുടെ AI ഇടയ്ക്കിടെ തെറ്റുകൾ വരുത്തുന്നുണ്ടെങ്കിൽ, അതിന്റെ സ്വയംഭരണാധികാരം (autonomy) ഉടൻ തന്നെ കുറയ്ക്കുക.

Source: https://dev.to/npayyappilly/the-human-in-the-loop-sre-designing-automation-escalation-policies-for-ai-assisted-operations-2c7f

Optional learning community: https://t.me/GyaanSetuAi

𝗧𝗵𝗲 𝗛𝘂𝗺𝗮𝗻 𝗶𝗻 𝘁𝗵𝗲 𝗟𝗼𝗼𝗽 𝗦𝗥𝗘

Continue reading

𝗛𝗼𝘄 𝗔𝗜 𝗖𝗵𝗮𝗻𝗴𝗲𝘀 𝗦𝗥𝗘 𝗪𝗼𝗿𝗸𝗳𝗹𝗼𝘄𝘀

𝗧𝗵𝗲 𝗜𝗻𝗳𝗿𝗮𝘀𝘁𝗿𝘂𝗰𝘁𝘂𝗿𝗲 𝗥𝘂𝗹𝗲 𝗙𝗼𝗿 𝗦𝗮𝗳𝗲 𝗔𝗜

𝗢𝗯𝘀𝗲𝗿𝘃𝗮𝗯𝗶𝗹𝗶𝘁𝘆 𝗶𝗻 𝗔𝗜: 𝗠𝗼𝗻𝗶𝘁𝗼𝗿𝗶𝗻𝗴 𝗶𝘀 𝗡𝗼𝘁 𝗘𝗻𝗼𝘂𝗴𝗵

𝗧𝗵𝗲 𝗨𝗻𝘀𝗲𝗲𝗻 𝗖𝗼𝗻𝘀𝗲𝗾𝘂𝗲𝗻𝗰𝗲𝘀 𝗼𝗳 𝗔𝗜

𝗛𝗼𝘄 𝘁𝗼 𝗘𝘃𝗮𝗹𝘂𝗮𝘁𝗲 𝗔𝗜 𝗦𝗥𝗘 𝗧𝗼𝗼𝗹𝘀