𝗨𝗻𝗱𝗲𝗿𝘀𝘁𝗮𝗻𝗱𝗶𝗻𝗴 𝗥𝗲𝘀𝗶𝗹𝗶𝗲𝗻𝘁 𝗔𝗜 𝗔𝗴𝗲𝗻𝘁𝘀

📅4 hours ago⏱1 min read

AI ലാബുകളിൽ നിന്ന് യഥാർത്ഥ ബിസിനസ്സ് ജോലികളിലേക്ക് മാറി. കസ്റ്റമർ സർവീസിനും ഫിനാൻസിനും കമ്പനികൾ AI ഉപയോഗിക്കുന്നു. ഇത് ഒരു വലിയ ചോദ്യത്തിലേക്ക് നയിക്കുന്നു: ഈ സിസ്റ്റങ്ങൾ പരാജയപ്പെട്ടാൽ എന്ത് സംഭവിക്കും?

നെറ്റ്‌വർക്ക് തകരാറുകളോ തെറ്റായ ഡാറ്റയോ ഉണ്ടാകുമ്പോഴും പ്രവർത്തിക്കുന്ന സിസ്റ്റങ്ങൾ നിങ്ങൾക്ക് ആവശ്യമാണ്. റെസിലിയന്റ് (Resilient) AI ഏജന്റുകൾ തകരാറിലാകില്ല (crash). അവ സാഹചര്യങ്ങൾക്കനുസരിച്ച് മാറുന്നു (adapt). അവ വീണ്ടും ശ്രമിക്കുന്നു (retry). സിസ്റ്റത്തിന്റെ ചില ഭാഗങ്ങൾ തകരാറിലായാലും അവ പ്രവർത്തനം തുടരുന്നു.

റെസിലിയൻസ് എന്നാൽ മൂന്ന് കാര്യങ്ങളാണ്:

ഫോൾട്ട് ടോളറൻസ് (Fault tolerance): ഒരു പിശക് കാരണം മുഴുവൻ സിസ്റ്റവും തകരാറിലാകില്ല.
അഡാപ്റ്റീവ് ബിഹേവിയർ (Adaptive behavior): ഒരു രീതി പരാജയപ്പെടുമ്പോൾ ഏജന്റുകൾ അവരുടെ പ്ലാൻ മാറ്റുന്നു.
ഗ്രേസ്ഫുൾ ഡിഗ്രഡേഷൻ (Graceful degradation): വേഗത കുറഞ്ഞാലും സിസ്റ്റത്തിന്റെ പ്രധാന ഫീച്ചറുകൾ പ്രവർത്തിച്ചുകൊണ്ടിരിക്കും.

ഒരു കസ്റ്റമർ സർവീസ് ബോട്ടിനെക്കുറിച്ച് ചിന്തിക്കുക. അതിന്റെ ഡാറ്റാബേസ് പ്രവർത്തനരഹിതമായാൽ ഒരു റെസിലിയന്റ് ബോട്ട് വെറുതെ പ്രവർത്തനം നിർത്തുകയല്ല ചെയ്യുന്നത്. അത് ഒരു ബാക്കപ്പ് വേർഷൻ ഉപയോഗിക്കുകയോ അല്ലെങ്കിൽ ഉപയോക്താവിനെ ഒരു മനുഷ്യനിലേക്ക് (human agent) കൈമാറുകയോ ചെയ്യുന്നു.

ഈ ഏജന്റുകളെ നിർമ്മിക്കാൻ നിങ്ങൾക്ക് ഈ ടൂളുകൾ ആവശ്യമാണ്:

മോണിറ്ററിംഗ് (Monitoring): പിശകുകളും റെസ്‌പോൺസ് സമയവും നിരീക്ഷിക്കുക.
റീട്രൈ ലോജിക് (Retry logic): സിസ്റ്റത്തിന് അമിതഭാരം നൽകാതെ വീണ്ടും ശ്രമിക്കുക.
സർക്യൂട്ട് ബ്രേക്കറുകൾ (Circuit breakers): തകരാറിലായ ഒരു സർവീസിലേക്ക് റിക്വസ്റ്റുകൾ അയക്കുന്നത് നിർത്തുക.
ഫോളബാക്ക് പ്ലാനുകൾ (Fallback plans): ആദ്യത്തെ വഴി പരാജയപ്പെടുമ്പോൾ രണ്ടാമതൊരു വഴി ഉപയോഗിക്കുക.
സ്റ്റേറ്റ് മാനേജ്‌മെന്റ് (State management): ഏജന്റിന് തകരാറിന് ശേഷം പഴയ അവസ്ഥയിലേക്ക് തിരിച്ചെത്താൻ പാകത്തിൽ പുരോഗതി (progress) സേവ് ചെയ്യുക.

പരാജയങ്ങൾ സാങ്കേതിക പിശകുകളേക്കാൾ വലിയ നഷ്ടമാണ് ഉണ്ടാക്കുന്നത്. നിങ്ങൾക്ക് ഉപഭോക്താക്കളുടെ വിശ്വാസം നഷ്ടപ്പെടുന്നു. വരുമാനം നഷ്ടപ്പെടുന്നു. നിയമപരമായ (compliance) റിസ്കുകൾ നേരിടേണ്ടി വരുന്നു.

പല ടീമുകളും കൃത്യതയിൽ (accuracy) മാത്രം ശ്രദ്ധ കേന്ദ്രീകരിക്കുന്നു. യഥാർത്ഥ സാഹചര്യങ്ങൾ സങ്കീർണ്ണമാണെന്ന് അവർ മറന്നുപോകുന്നു. നെറ്റ്‌വർക്ക് ലാഗും (lag) ഉയർന്ന ഉപയോക്തൃ തിരക്കും (user load) ടെസ്റ്റിംഗ് എൻവയോൺമെന്റുകളിൽ കണ്ടെത്താൻ കഴിയാത്ത പ്രശ്നങ്ങൾ സൃഷ്ടിക്കുന്നു.

റെസിലിയൻസ് AI-യെ ഒരു കളിപ്പാട്ടത്തിൽ നിന്ന് ഒരു ബിസിനസ്സ് അസറ്റായി (business asset) മാറ്റുന്നു.

ഈ ഘട്ടങ്ങളിലൂടെ തുടങ്ങുക:

എന്ത് തെറ്റുകൾ സംഭവിക്കാം എന്ന് മുൻകൂട്ടി നിശ്ചയിക്കുക.
വിശദമായ ലോഗിംഗ് (logging) ഉപയോഗിക്കുക.
ഒരു "ലിമിറ്റഡ് മോഡ്" (limited mode) എങ്ങനെയായിരിക്കണമെന്ന് തീരുമാനിക്കുക.
ടെസ്റ്റിംഗ് സമയത്ത് മനഃപൂർവ്വം തകരാറുകൾ വരുത്തി പരിശോധിക്കുക.
സാങ്കേതിക വിവരങ്ങളും ബിസിനസ്സ് ഫലങ്ങളും ഒരേപോലെ നിരീക്ഷിക്കുക.

റെസിലിയൻസ് എന്നത് ഒരു അധിക ഫീച്ചറല്ല. അത് ഒരു അനിവാര്യതയാണ്.

Source: https://dev.to/cheryl_dmahaffey_e677cc8/understanding-resilient-ai-agents-a-beginners-guide-to-enterprise-ai-3igh

Optional learning community: https://t.me/GyaanSetuAi

𝗨𝗻𝗱𝗲𝗿𝘀𝘁𝗮𝗻𝗱𝗶𝗻𝗴 𝗥𝗲𝘀𝗶𝗹𝗶𝗲𝗻𝘁 𝗔𝗜 𝗔𝗴𝗲𝗻𝘁𝘀

Continue reading

𝗥𝗲𝘀𝗶𝗹𝗶𝗲𝗻𝘁 𝗔𝗜 𝗔𝗴𝗲𝗻𝘁𝘀: 𝗔𝗿𝗰𝗵𝗶𝘁𝗲𝗰𝘁𝘂𝗿𝗲 𝗖𝗼𝗺𝗽𝗮𝗿𝗶𝘀𝗼𝗻

അതിജീവനശേഷിയുള്ള AI ഏജന്റുകളെ നിർമ്മിക്കൽ

𝟳 𝗠𝗶𝘀𝘁𝗮𝗸𝗲𝘀 𝗧𝗵𝗮𝘁 𝗕𝗿𝗲𝗮𝗸 𝗔𝗜 𝗔𝗴𝗲𝗻𝘁𝘀

𝗥𝗲𝘀𝗶𝗹𝗶𝗲𝗻𝘁 𝗔𝗜 𝗔𝗴𝗲𝗻𝘁𝘀: 𝗔𝗿𝗰𝗵𝗶𝘁𝗲𝗰𝘁𝘂𝗿𝗲 𝗖𝗼𝗺𝗽𝗮𝗿𝗶𝘀𝗼𝗻

𝟳 𝗖𝗿𝗶𝘁𝗶𝗰𝗮𝗹 𝗠𝗶𝘀𝘁𝗮𝗸𝗲𝘀 𝗧𝗵𝗮𝘁 𝗕𝗿𝗲𝗮𝗸 𝗔𝗜 𝗔𝗴𝗲𝗻𝘁𝘀