𝗨𝗻𝗱𝗲𝗿𝘀𝘁𝗮𝗻𝗱𝗶𝗻𝗴 𝗥𝗲𝘀𝗶𝗹𝗶𝗲𝗻𝘁 𝗔𝗜 𝗔𝗴𝗲𝗻𝘁𝘀
AI ലാബുകളിൽ നിന്ന് യഥാർത്ഥ ബിസിനസ്സ് ജോലികളിലേക്ക് മാറി. കസ്റ്റമർ സർവീസിനും ഫിനാൻസിനും കമ്പനികൾ AI ഉപയോഗിക്കുന്നു. ഇത് ഒരു വലിയ ചോദ്യത്തിലേക്ക് നയിക്കുന്നു: ഈ സിസ്റ്റങ്ങൾ പരാജയപ്പെട്ടാൽ എന്ത് സംഭവിക്കും?
നെറ്റ്വർക്ക് തകരാറുകളോ തെറ്റായ ഡാറ്റയോ ഉണ്ടാകുമ്പോഴും പ്രവർത്തിക്കുന്ന സിസ്റ്റങ്ങൾ നിങ്ങൾക്ക് ആവശ്യമാണ്. റെസിലിയന്റ് (Resilient) AI ഏജന്റുകൾ തകരാറിലാകില്ല (crash). അവ സാഹചര്യങ്ങൾക്കനുസരിച്ച് മാറുന്നു (adapt). അവ വീണ്ടും ശ്രമിക്കുന്നു (retry). സിസ്റ്റത്തിന്റെ ചില ഭാഗങ്ങൾ തകരാറിലായാലും അവ പ്രവർത്തനം തുടരുന്നു.
റെസിലിയൻസ് എന്നാൽ മൂന്ന് കാര്യങ്ങളാണ്:
- ഫോൾട്ട് ടോളറൻസ് (Fault tolerance): ഒരു പിശക് കാരണം മുഴുവൻ സിസ്റ്റവും തകരാറിലാകില്ല.
- അഡാപ്റ്റീവ് ബിഹേവിയർ (Adaptive behavior): ഒരു രീതി പരാജയപ്പെടുമ്പോൾ ഏജന്റുകൾ അവരുടെ പ്ലാൻ മാറ്റുന്നു.
- ഗ്രേസ്ഫുൾ ഡിഗ്രഡേഷൻ (Graceful degradation): വേഗത കുറഞ്ഞാലും സിസ്റ്റത്തിന്റെ പ്രധാന ഫീച്ചറുകൾ പ്രവർത്തിച്ചുകൊണ്ടിരിക്കും.
ഒരു കസ്റ്റമർ സർവീസ് ബോട്ടിനെക്കുറിച്ച് ചിന്തിക്കുക. അതിന്റെ ഡാറ്റാബേസ് പ്രവർത്തനരഹിതമായാൽ ഒരു റെസിലിയന്റ് ബോട്ട് വെറുതെ പ്രവർത്തനം നിർത്തുകയല്ല ചെയ്യുന്നത്. അത് ഒരു ബാക്കപ്പ് വേർഷൻ ഉപയോഗിക്കുകയോ അല്ലെങ്കിൽ ഉപയോക്താവിനെ ഒരു മനുഷ്യനിലേക്ക് (human agent) കൈമാറുകയോ ചെയ്യുന്നു.
ഈ ഏജന്റുകളെ നിർമ്മിക്കാൻ നിങ്ങൾക്ക് ഈ ടൂളുകൾ ആവശ്യമാണ്:
- മോണിറ്ററിംഗ് (Monitoring): പിശകുകളും റെസ്പോൺസ് സമയവും നിരീക്ഷിക്കുക.
- റീട്രൈ ലോജിക് (Retry logic): സിസ്റ്റത്തിന് അമിതഭാരം നൽകാതെ വീണ്ടും ശ്രമിക്കുക.
- സർക്യൂട്ട് ബ്രേക്കറുകൾ (Circuit breakers): തകരാറിലായ ഒരു സർവീസിലേക്ക് റിക്വസ്റ്റുകൾ അയക്കുന്നത് നിർത്തുക.
- ഫോളബാക്ക് പ്ലാനുകൾ (Fallback plans): ആദ്യത്തെ വഴി പരാജയപ്പെടുമ്പോൾ രണ്ടാമതൊരു വഴി ഉപയോഗിക്കുക.
- സ്റ്റേറ്റ് മാനേജ്മെന്റ് (State management): ഏജന്റിന് തകരാറിന് ശേഷം പഴയ അവസ്ഥയിലേക്ക് തിരിച്ചെത്താൻ പാകത്തിൽ പുരോഗതി (progress) സേവ് ചെയ്യുക.
പരാജയങ്ങൾ സാങ്കേതിക പിശകുകളേക്കാൾ വലിയ നഷ്ടമാണ് ഉണ്ടാക്കുന്നത്. നിങ്ങൾക്ക് ഉപഭോക്താക്കളുടെ വിശ്വാസം നഷ്ടപ്പെടുന്നു. വരുമാനം നഷ്ടപ്പെടുന്നു. നിയമപരമായ (compliance) റിസ്കുകൾ നേരിടേണ്ടി വരുന്നു.
പല ടീമുകളും കൃത്യതയിൽ (accuracy) മാത്രം ശ്രദ്ധ കേന്ദ്രീകരിക്കുന്നു. യഥാർത്ഥ സാഹചര്യങ്ങൾ സങ്കീർണ്ണമാണെന്ന് അവർ മറന്നുപോകുന്നു. നെറ്റ്വർക്ക് ലാഗും (lag) ഉയർന്ന ഉപയോക്തൃ തിരക്കും (user load) ടെസ്റ്റിംഗ് എൻവയോൺമെന്റുകളിൽ കണ്ടെത്താൻ കഴിയാത്ത പ്രശ്നങ്ങൾ സൃഷ്ടിക്കുന്നു.
റെസിലിയൻസ് AI-യെ ഒരു കളിപ്പാട്ടത്തിൽ നിന്ന് ഒരു ബിസിനസ്സ് അസറ്റായി (business asset) മാറ്റുന്നു.
ഈ ഘട്ടങ്ങളിലൂടെ തുടങ്ങുക:
- എന്ത് തെറ്റുകൾ സംഭവിക്കാം എന്ന് മുൻകൂട്ടി നിശ്ചയിക്കുക.
- വിശദമായ ലോഗിംഗ് (logging) ഉപയോഗിക്കുക.
- ഒരു "ലിമിറ്റഡ് മോഡ്" (limited mode) എങ്ങനെയായിരിക്കണമെന്ന് തീരുമാനിക്കുക.
- ടെസ്റ്റിംഗ് സമയത്ത് മനഃപൂർവ്വം തകരാറുകൾ വരുത്തി പരിശോധിക്കുക.
- സാങ്കേതിക വിവരങ്ങളും ബിസിനസ്സ് ഫലങ്ങളും ഒരേപോലെ നിരീക്ഷിക്കുക.
റെസിലിയൻസ് എന്നത് ഒരു അധിക ഫീച്ചറല്ല. അത് ഒരു അനിവാര്യതയാണ്.
Optional learning community: https://t.me/GyaanSetuAi