𝗧𝗵𝗲 𝗧𝗼𝗼𝗹 𝗖𝗮𝗹𝗹 𝗦𝘂𝗰𝗰𝗲𝗲𝗱𝗲𝗱. 𝗧𝗵𝗲 𝗢𝘂𝘁𝗰𝗼𝗺𝗲 𝗙𝗮𝗶𝗹𝗲𝗱.

Translated for your language. Read the original.

AI-assisted draft.

മിനിഞ്ഞാന്ന്2min read

ടൂൾ കോൾ വിജയിച്ചു. ഫലം പരാജയപ്പെട്ടു.

എഞ്ചിനീയറിംഗ് ടീമുകൾ പലപ്പോഴും തെറ്റായ സൂചനകളാണ് തിരയുന്നത്.

നിങ്ങൾ ക്രാഷുകൾ (crashes) തിരയുന്നു. നിങ്ങൾ എക്സെപ്ഷനുകൾ (exceptions) തിരയുന്നു. നിങ്ങൾ ചുവന്ന ഡാഷ്‌ബോർഡുകൾ തിരയുന്നു.

ഏറ്റവും മോശമായ പരാജയങ്ങളിൽ ചിലത് പരാജയങ്ങൾ പോലെ തോന്നില്ല. അവ വിജയങ്ങൾ പോലെ തോന്നും.

AI ഏജന്റുകളുമായും (AI agents) MCP സെർവറുകളുമായും പ്രവർത്തിക്കുമ്പോൾ ഞാൻ ഈ രീതി ശ്രദ്ധിച്ചു. ഒരു ഏജന്റ് ഒരു ടൂൾ വിളിക്കുന്നു. ടൂൾ ഒരു വിജയകരമായ മറുപടി നൽകുന്നു. അവിടെ തെറ്റുകളില്ല. ടൈമൗട്ട് (timeout) സംഭവിക്കുന്നില്ല. സിസ്റ്റം സുഗമമായി പ്രവർത്തിക്കുന്നതായി കാണപ്പെടുന്നു.

എന്നാൽ ആ ടാസ്ക് പരാജയപ്പെട്ടു. ആ പ്രവർത്തനം ഒരിക്കലും നടന്നില്ല. ഉപയോക്താവിന് തെറ്റായ ഫലം ലഭിക്കുന്നു.

നിങ്ങളുടെ ടീമിനേക്കാൾ മുൻപേ ഉപഭോക്താവ് ഈ പ്രശ്നം കണ്ടെത്തിത്തുടങ്ങുന്നു.

മിക്ക സോഫ്റ്റ്‌വെയറുകളും പ്രവർത്തിക്കുന്നത് ഒരു ആശയത്തിലാണ്: റിക്വസ്റ്റ് (request) വിജയിച്ചാൽ ഫലവും (outcome) വിജയിക്കും.

നിങ്ങൾ എക്സ്റ്റേണൽ സിസ്റ്റങ്ങൾ (external systems) ഉപയോഗിക്കുമ്പോൾ ഈ ആശയം പരാജയപ്പെടുന്നു. AI ഏജന്റുകൾ APIs, ഡാറ്റാബേസുകൾ, SaaS പ്ലാറ്റ്‌ഫോമുകൾ എന്നിവയെ ആശ്രയിക്കുന്നു. ഓരോ ഡിപെൻഡൻസിയും (dependency) റിക്വസ്റ്റും യാഥാർത്ഥ്യവും തമ്മിൽ ഒരു വിടവ് സൃഷ്ടിക്കുന്നു.

സിസ്റ്റം വിജയം റിപ്പോർട്ട് ചെയ്യുന്നു. എന്നാൽ യാഥാർത്ഥ്യം ഒരു പരാജയമാണ്.

ഉദാഹരണങ്ങൾ:

• ടൂൾ ഒരു സാധുവായ മറുപടി നൽകുന്നു, പക്ഷേ ഫലം null ആണ്. ഏജന്റ് അപൂർണ്ണമായ ഡാറ്റയുമായി മുന്നോട്ട് പോകുന്നു. • ഒരു റിക്വസ്റ്റ് മൂന്ന് പ്രവർത്തനങ്ങൾ ആരംഭിക്കുന്നു. അതിൽ ഒന്ന് മാത്രമേ പൂർത്തിയാകുന്നുള്ളൂ. എങ്കിലും ടൂൾ വിജയം റിപ്പോർട്ട് ചെയ്യുന്നു. നിങ്ങളുടെ വർക്ക്ഫ്ലോ (workflow) ഇപ്പോൾ തകരാറിലായിരിക്കുന്നു. • മറുപടി വിജയകരമായി ലഭിക്കുന്നു, പക്ഷേ ഡാറ്റ പഴയതാണ്. ഏജന്റ് കാലഹരണപ്പെട്ട വിവരങ്ങളുടെ അടിസ്ഥാനത്തിൽ തീരുമാനങ്ങൾ എടുക്കുന്നു. • ഒരു ഫീൽഡിന്റെ ഫോർമാറ്റ് മാറുന്നു. സിസ്റ്റത്തിന് ഡാറ്റ ലഭിക്കുന്നുണ്ടെങ്കിലും അതിന്റെ അർത്ഥം തെറ്റാണ്. വർക്ക്ഫ്ലോ നിശബ്ദമായി തകരാറിലാകുന്നു.

ക്രാഷുകൾ കണ്ടെത്താൻ എളുപ്പമാണ്. നിശബ്ദമായ പരാജയങ്ങൾ (silent failures) കണ്ടെത്താൻ പ്രയാസമാണ്.

ഒരു ക്രാഷ് ഒരു അലേർട്ട് (alert) നൽകുന്നു. ഒരു നിശബ്ദ പരാജയം ഉപയോക്താവിന്റെ വിശ്വാസം തകർക്കുന്നു. നാശനഷ്ടങ്ങൾ സംഭവിച്ചതിന് ശേഷം എഞ്ചിനീയർമാർ മണിക്കൂറുകളോളം ഡീബഗ്ഗിംഗിനായി (debugging) ചെലവഴിക്കുന്നു.

സാധാരണയായി ഒരു ഉപഭോക്താവ് പരാതിപ്പെടുമ്പോഴാണ് അന്വേഷണം ആരംഭിക്കുന്നത്. ഒരു റിലയബിലിറ്റി പ്രശ്നം (reliability problem) കണ്ടെത്താനുള്ള ഏറ്റവും ചിലവേറിയ മാർഗ്ഗമാണിത്.

വിജയകരമായ റിക്വസ്റ്റുകളെ മാത്രം വിശ്വസിക്കുന്നത് നിർത്തുക. വിജയകരമായ ഫലങ്ങളെ (outcomes) പരിശോധിച്ചു ഉറപ്പുവരുത്താൻ തുടങ്ങുക.

ഒരു റെസ്പോൺസ് കോഡ് (response code) ആശയവിനിമയം നടന്നോ എന്ന് മാത്രമേ നിങ്ങളോട് പറയൂ. ലക്ഷ്യം പൂർത്തീകരിക്കപ്പെട്ടോ എന്ന് അത് പറയില്ല.

നിങ്ങളുടെ അവസാനത്തെ 10 പ്രൊഡക്ഷൻ ടൂൾ കോളുകൾ പരിശോധിക്കുക. ഈ ചോദ്യങ്ങൾ ചോദിക്കുക:

റിക്വസ്റ്റ് വിജയിച്ചോ?
ഉദ്ദേശിച്ച ഫലം ലഭിച്ചോ?
അത് പരാജയപ്പെട്ടാൽ നമുക്ക് എങ്ങനെ അറിയാൻ കഴിയും?

ഉത്തരങ്ങളിൽ വ്യത്യാസമുണ്ടെങ്കിൽ, അവിടെ ഒരു റിലയബിലിറ്റി ഗ്യാപ്പ് (reliability gap) ഉണ്ട്. നിങ്ങൾ കണ്ടെത്തുന്നില്ലെങ്കിൽ നിങ്ങളുടെ ഉപയോക്താക്കൾ അത് ഉടൻ കണ്ടെത്തും.

Source: https://dev.to/sasi_sundar/the-tool-call-succeeded-the-outcome-failed-3l59

Optional learning community: https://t.me/GyaanSetuAi

𝗧𝗵𝗲 𝗧𝗼𝗼𝗹 𝗖𝗮𝗹𝗹 𝗦𝘂𝗰𝗰𝗲𝗲𝗱𝗲𝗱. 𝗧𝗵𝗲 𝗢𝘂𝘁𝗰𝗼𝗺𝗲 𝗙𝗮𝗶𝗹𝗲𝗱.

Continue reading

𝟳 𝗠𝗶𝘀𝘁𝗮𝗸𝗲𝘀 𝗧𝗵𝗮𝘁 𝗕𝗿𝗲𝗮𝗸 𝗔𝗜 𝗔𝗴𝗲𝗻𝘁𝘀

𝗧𝗵𝗲 𝗠𝗼𝗱𝗲𝗹 𝗜𝘀 𝗡𝗼𝘁 𝘁𝗵𝗲 𝗣𝗿𝗼𝗱𝘂𝗰𝘁. 𝗛𝗲𝗿𝗲'𝘀 𝗪𝗵𝗮𝘁 𝗔𝗰𝘁𝘂𝗮𝗹𝗹𝘆 𝗜𝘀.

𝗔𝗜 𝗔𝗴𝗲𝗻𝘁𝘀 𝗛𝗮𝘃𝗲 𝗔 𝗥𝗲𝗹𝗶𝗮𝗯𝗶𝗹𝗶𝘁𝘆 𝗣𝗿𝗼𝗯𝗹𝗲𝗺

𝗕𝗹𝗼𝗰𝗸𝗲𝗱 𝗜𝘀 𝗡𝗼𝘁 𝗙𝗮𝗶𝗹𝗲𝗱: 𝗔𝗴𝗲𝗻𝘁𝘀 𝗡𝗲𝗲𝗱 𝗕𝗼𝘂𝗻𝗱𝗮𝗿𝘆 𝗙𝗲𝗲𝗱𝗯𝗮𝗰𝗸

𝗕𝘂𝗶𝗹𝗱𝗶𝗻𝗴 𝗔𝗜 𝗔𝗴𝗲𝗻𝘁𝘀 𝗧𝗵𝗮𝘁 𝗗𝗼𝗻'𝘁 𝗛𝗮𝗹𝗹𝘂𝗰𝗶𝗻𝗮𝘁𝗲