ഏജന്റിക് AI-യിലെ കപ്പാബിലിറ്റീസും (Capabilities) ടൂളുകളും (Tools)

ആളുകൾ പലപ്പോഴും AI ഏജന്റുകളെ അളക്കുന്നത് അവ ഉപയോഗിക്കുന്ന ടൂളുകളുടെ എണ്ണത്തിന്റെ അടിസ്ഥാനത്തിലാണ്.

ഒരു ഏജന്റിന് വെബ് ബ്രൗസ് ചെയ്യാനോ, കോഡ് റൺ ചെയ്യാനോ, അല്ലെങ്കിൽ ഒരു ഡാറ്റാബേസ് ക്വറി ചെയ്യാനോ കഴിയുമോ എന്ന് അവർ ചോദിക്കുന്നു. ഇതിന്റെ യുക്തി ലളിതമാണ്: കൂടുതൽ ടൂളുകൾ എന്നാൽ മികച്ച ഏജന്റ് എന്നാണ് അർത്ഥം.

ഈ യുക്തി തെറ്റാണ്.

ടൂളുകളും ശേഷികളും (capabilities) വ്യത്യസ്തമാണ്. മികച്ച AI നിർമ്മിക്കുന്നതിന് ഈ വ്യത്യാസം നിങ്ങൾ മനസ്സിലാക്കണം.

ഒരു ടൂൾ എന്നത് ഒരു ഇന്റർഫേസ് ആണ്. അത് ഒരു ഏജന്റിന് ലോകവുമായി ഇടപഴകാൻ സഹായിക്കുന്നു.

ടൂളുകളിൽ ഇവ ഉൾപ്പെടുന്നു:

  • വെബ് സെർച്ച് (Web search)
  • ഡാറ്റാബേസുകൾ (Databases)
  • APIs
  • ഫയൽ സിസ്റ്റങ്ങൾ (File systems)
  • ഇമെയിൽ പ്ലാറ്റ്‌ഫോമുകൾ (Email platforms)

ഒരു ടൂൾ തീരുമാനങ്ങൾ എടുക്കുന്നില്ല. അത് ഒരു പ്രവൃത്തി (action) മാത്രം ചെയ്യുന്നു. ടൂളുകളെ ഒരു ഏജന്റിന്റെ പ്രവർത്തനപരിധിയുടെ വിപുലീകരണമായി കാണുക. അവ ഒരു ഏജന്റിനെ പ്രവർത്തിക്കാൻ അനുവദിക്കുന്നു, എന്നാൽ എപ്പോൾ അല്ലെങ്കിൽ എന്തുകൊണ്ട് പ്രവർത്തിക്കണം എന്ന് അവ നിർദ്ദേശിക്കുന്നില്ല.

ഒരു പ്രശ്നം പരിഹരിക്കുന്നത് ശേഷികളാണ് (capabilities). ശേഷികൾ എന്നത് വൈജ്ഞാനികമായ (cognitive) കാര്യങ്ങളാണ്.

ശേഷികളിൽ ഇവ ഉൾപ്പെടുന്നു:

  • ഘട്ടങ്ങൾ ക്രമമായി ആസൂത്രണം ചെയ്യുക (Planning a sequence of steps)
  • സങ്കീർണ്ണമായ ലക്ഷ്യങ്ങളെ ചെറിയ ഭാഗങ്ങളായി തിരിക്കുക (Breaking down complex goals)
  • ശരിയായ ടൂൾ തിരഞ്ഞെടുക്കുക (Choosing the right tool)
  • ഫലങ്ങളെ വിശകലനം ചെയ്ത് യുക്തിപരമായ തീരുമാനങ്ങൾ എടുക്കുക (Reasoning through results)
  • പരാജയപ്പെട്ടതിന് ശേഷം തന്ത്രങ്ങൾ മാറ്റം വരുത്തുക (Adjusting strategy after a failure)

ഒരു ഏജന്റ് എങ്ങനെ ചിന്തിക്കുന്നു എന്നത് അതിന്റെ ശേഷികൾ തീരുമാനിക്കുന്നു.

ഒരേ ടൂളുകൾ മാത്രം ഉപയോഗിക്കുന്ന (ഒരു ബ്രൗസറും ഒരു ഡാറ്റാബേസും ഉള്ള) രണ്ട് ഏജന്റുകളെ സങ്കൽപ്പിക്കുക.

ഏജന്റ് A ഡാറ്റാബേസ് ക്വറി ചെയ്യുന്നു, ഒരു സ്ക്രിപ്റ്റ് എഴുതുന്നു, എന്നാൽ തെറ്റായ ഉത്തരം നൽകുന്നു.

ഏജന്റ് B ആവശ്യമായ ഡാറ്റ തിരിച്ചറിയുന്നു, ഏറ്റവും മികച്ച സ്രോതസ്സ് തിരഞ്ഞെടുക്കുന്നു, ഫലങ്ങൾ പരിശോധിക്കുന്നു, തുടർന്ന് മറുപടി നൽകുന്നു.

ടൂളുകൾ ഒന്നാണ്. വ്യത്യാസം യുക്തിപരമായ ചിന്തയിലാണ് (reasoning).

ശേഷികൾ തീരുമാനിക്കുന്നു. ടൂളുകൾ പ്രവർത്തിപ്പിക്കുന്നു.

  • ആസൂത്രണം (Planning) അടുത്തതായി എന്ത് സംഭവിക്കണമെന്ന് പറയുന്നു.
  • യുക്തി (Reasoning) അത് എന്തുകൊണ്ട് സംഭവിക്കുന്നു എന്ന് പറയുന്നു.
  • ടൂൾ തിരഞ്ഞെടുക്കുന്നത് അത് എങ്ങനെ സംഭവിക്കുന്നു എന്ന് പറയുന്നു.
  • എക്സിക്യൂഷൻ (Execution) എന്നത് അവസാന ഘട്ടമാണ്.

ശേഷികൾ വർദ്ധിപ്പിക്കാതെ ടൂളുകൾ മാത്രം കൂട്ടിച്ചേർക്കുന്നത് ഒരു തെറ്റാണ്. ഇത് കൂടുതൽ ചിലവിനും കൂടുതൽ പിശകുകൾക്കും കാരണമാകുന്നു. കൂടുതൽ ടൂളുകൾ എന്നാൽ പിന്തുടരാൻ കൂടുതൽ വഴികളും പരാജയപ്പെടാൻ കൂടുതൽ സാധ്യതകളും എന്നാണ് അർത്ഥം.

ഇത് നിർമ്മാണം എങ്ങനെ ചെയ്യണമെന്ന് അറിയാത്ത ഒരാൾക്ക് മികച്ച ഒരു ടൂൾബോക്സ് നൽകുന്നത് പോലെയാണ്.

നിങ്ങൾ ഒരു ഏജന്റിനെ രൂപകൽപ്പന ചെയ്യുമ്പോൾ, അതിന് ഏത് ടൂളുകൾ വേണം എന്ന് ചോദിക്കുന്നത് നിർത്തുക. പകരം അതിന് ഏത് ശേഷികളാണ് കുറവുള്ളത് എന്ന് ചോദിച്ചു തുടങ്ങുക.

ഇതിനുള്ള ഉത്തരം മറ്റൊരു API ആയിരിക്കില്ല. മികച്ച ആസൂത്രണവും മികച്ച തീരുമാനമെടുക്കലുമാണ് ഉത്തരം.

മൂന്ന് ടൂളുകളുള്ള ഒരു ബുദ്ധിമാനായ ഏജന്റ്, മുപ്പത് ടൂളുകളുള്ള ഒരു വിഡ്ഢിയായ ഏജന്റിനെ തോൽപ്പിക്കും.

ഒരു ഏജന്റിനെ അളക്കേണ്ടത് അതിന്റെ ടൂൾബോക്സിന്റെ വലുപ്പം നോക്കിയല്ല, മറിച്ച് അത് എങ്ങനെ അതിന്റെ ടൂൾബോക്സ് ഉപയോഗിക്കുന്നു എന്ന് നോക്കിയാണ്.

Source: https://dev.to/rohith_kn/capabilities-vs-tools-in-agentic-ai-theyre-not-the-same-thing-3lg7