ടൂൾ കോളിംഗ്: എഐ ഏജന്റുകൾ എന്ത് ചെയ്യണമെന്ന് എങ്ങനെ തീരുമാനിക്കുന്നു

Translated for your language. Read the original.

AI-assisted draft.

GyaanSetu Editorial2 ആഴ്ച മുമ്പ്2min read

ടൂൾ കോളിംഗ്: എഐ ഏജന്റുകൾ എന്ത് ചെയ്യണമെന്ന് എങ്ങനെ തീരുമാനിക്കുന്നു

Tool Calling: AI ഏജന്റുകൾ എന്ത് ചെയ്യണമെന്ന് എങ്ങനെ തീരുമാനിക്കുന്നു

AI മോഡലുകൾ വെറും ചാറ്റിംഗിന് അപ്പുറത്തേക്ക് വളരുകയാണ്. അവ ഇപ്പോൾ പ്രവർത്തികൾ (actions) ചെയ്യാൻ തുടങ്ങിയിരിക്കുന്നു.

മിക്ക മോഡലുകളും ഒരു നിശ്ചിത കാലഘട്ടത്തിൽ ഒതുങ്ങിനിൽക്കുന്നവയാണ്. പരിശീലന സമയത്ത് (training) അവ പഠിച്ച കാര്യങ്ങൾ മാത്രമേ അവയ്ക്ക് അറിയൂ. അവയ്ക്ക് തനിയെ ഇന്നത്തെ ഓഹരി വിലകൾ പരിശോധിക്കാനോ നിങ്ങളുടെ കലണ്ടറിൽ ഒരു മീറ്റിംഗ് ബുക്ക് ചെയ്യാനോ കഴിയില്ല.

ടൂൾ കോളിംഗ് (Tool calling) ഇത് മാറ്റുന്നു. ഇത് ഒരു AI മോഡലിന് കൈകളും കണ്ണുകളും നൽകുന്നു.

ഇത് എങ്ങനെ പ്രവർത്തിക്കുന്നു:

ഡെവലപ്പർമാർ മോഡലിന് ചില ടൂളുകൾ നൽകുന്നു. കാൽക്കുലേറ്റർ, സെർച്ച് എഞ്ചിൻ അല്ലെങ്കിൽ ഒരു ഡാറ്റാബേസ് പോലുള്ള API-കളാണ് ഈ ടൂളുകൾ.

വെറുതെ ടെക്സ്റ്റ് എഴുതുന്നതിന് പകരം, മോഡൽ ഒരു ലൂപ്പ് (loop) പിന്തുടരുന്നു:

• ചിന്താശേഷി (Reasoning): മോഡൽ നിങ്ങളുടെ അഭ്യർത്ഥന വായിക്കുന്നു. • പ്രവർത്തനം (Action): ഒരു ടൂൾ ആവശ്യമാണെന്ന് മോഡൽ തീരുമാനിക്കുന്നു. അത് ടൂളിലേക്ക് ഒരു സ്ട്രക്ചർഡ് റിക്വസ്റ്റ് (JSON പോലുള്ളവ) അയക്കുന്നു. • നിരീക്ഷണം (Observation): ടൂൾ ആ ജോലി ചെയ്യുന്നു, തുടർന്ന് ഡാറ്റ തിരികെ അയക്കുന്നു. • പ്രതികരണം (Response): ആ പുതിയ ഡാറ്റ ഉപയോഗിച്ച് മോഡൽ നിങ്ങൾക്ക് അന്തിമ ഉത്തരം നൽകുന്നു.

ഉദാഹരണം:

നിങ്ങൾ "ഇന്ന് ഓസ്റ്റിനിൽ (Austin) എനിക്ക് ഒരു ജാക്കറ്റ് ആവശ്യമുണ്ടോ?" എന്ന് ചോദിച്ചാൽ, മോഡൽ വെറുതെ ഊഹിച്ചു പറയില്ല.

അത് ഒരു വെതർ ടൂൾ (weather tool) തിരിച്ചറിയുന്നു.
അത് "Austin, TX" എന്ന ലൊക്കേഷൻ ആ ടൂളിലേക്ക് അയക്കുന്നു.
അത് നിലവിലെ താപനില സ്വീകരിക്കുന്നു.
അത് നിങ്ങളോട് പറയുന്നു, "താപനില 58 ഡിഗ്രിയാണ്, കാറ്റും ഉണ്ട്, അതിനാൽ ഒരു ജാക്കറ്റ് കരുതുക."

ഇത് ഒരു നിഷ്ക്രിയമായ (passive) ചാറ്റ്ബോട്ടിനെ സജീവമായ (active) ഒരു ഏജന്റാക്കി മാറ്റുന്നു.

ഇതിന്റെ രഹസ്യം വിവരണത്തിലാണ് (description). നിങ്ങൾ ഒരു ടൂളിന് അവ്യക്തമായ പേര് നൽകിയാൽ, മോഡൽ പരാജയപ്പെടും. എന്നാൽ വ്യക്തവും കൃത്യവുമായ ഒരു വിവരണം നൽകിയാൽ, അത് എപ്പോൾ ഉപയോഗിക്കണമെന്ന് മോഡലിന് കൃത്യമായി അറിയാൻ സാധിക്കും.

ഇത്തരം സിസ്റ്റങ്ങൾ നിർമ്മിക്കുമ്പോൾ മൂന്ന് കാര്യങ്ങളിൽ ശ്രദ്ധ കേന്ദ്രീകരിക്കണം:

വേഗത (Speed): ഓരോ ടൂൾ കോളിനും സമയം എടുക്കും. കൂടുതൽ ഘട്ടങ്ങൾ ഉണ്ടെങ്കിൽ AI പതുക്കെയാകും.
സുരക്ഷ (Safety): ഒരു ടൂളിന് ഇമെയിലുകൾ അയക്കാനോ പണം കൈമാറാനോ കഴിയുമെങ്കിൽ, മനുഷ്യന്റെ അനുമതി (human approval) കൂടി ഉൾപ്പെടുത്തണം.
വിശ്വാസ്യത (Reliability): API-കൾ പരാജയപ്പെട്ടേക്കാം. പിശകുകൾ (errors) കണ്ടെത്താനും മോഡലിനോട് വീണ്ടും ശ്രമിക്കാൻ ആവശ്യപ്പെടാനും കഴിയുന്ന രീതിയിൽ സിസ്റ്റങ്ങൾ നിർമ്മിക്കണം.

വാക്കുകൾക്കും പ്രവൃത്തികൾക്കും ഇടയിലുള്ള പാലമാണ് ടൂൾ കോളിംഗ്. ഇത് കൃത്യമായി പഠിച്ചാൽ മാത്രമേ യഥാർത്ഥത്തിൽ ജോലികൾ ചെയ്തുതീർക്കുന്ന AI നിർമ്മിക്കാൻ സാധിക്കൂ.

Source: https://dev.to/med_stream_93ad6cad6d2bee/tool-calling-explained-how-ai-agents-decide-what-to-do-next-3n3b

Optional learning community: https://t.me/GyaanSetuAi

ടൂൾ കോളിംഗ്: എഐ ഏജന്റുകൾ എന്ത് ചെയ്യണമെന്ന് എങ്ങനെ തീരുമാനിക്കുന്നു

Continue reading

𝗧𝗵𝗲 𝗛𝗼𝘁𝘁𝗲𝘀𝘁 𝗔𝗜 𝗙𝗿𝗮𝗺𝗲𝘄𝗼𝗿𝗸 𝗥𝗶𝗴𝗵𝘁 𝗡𝗼𝘄 𝗛𝗮𝘀 𝗮 𝗙𝗮𝘁𝗮𝗹 𝗙𝗹𝗮𝘄

AI ഏജന്റുകളും ടൂൾ കോളിംഗും

പ്രൊഡക്ഷനിൽ AI ഏജന്റുകൾ പ്രവർത്തിപ്പിക്കുമ്പോൾ ഞാൻ പഠിച്ച കാര്യങ്ങൾ

The Window to Build AI Expertise Is Closing

Inside An AI Agent