Tool Calling: AI ഏജന്റുകൾ എന്ത് ചെയ്യണമെന്ന് എങ്ങനെ തീരുമാനിക്കുന്നു
AI മോഡലുകൾ വെറും ചാറ്റിംഗിന് അപ്പുറത്തേക്ക് വളരുകയാണ്. അവ ഇപ്പോൾ പ്രവർത്തികൾ (actions) ചെയ്യാൻ തുടങ്ങിയിരിക്കുന്നു.
മിക്ക മോഡലുകളും ഒരു നിശ്ചിത കാലഘട്ടത്തിൽ ഒതുങ്ങിനിൽക്കുന്നവയാണ്. പരിശീലന സമയത്ത് (training) അവ പഠിച്ച കാര്യങ്ങൾ മാത്രമേ അവയ്ക്ക് അറിയൂ. അവയ്ക്ക് തനിയെ ഇന്നത്തെ ഓഹരി വിലകൾ പരിശോധിക്കാനോ നിങ്ങളുടെ കലണ്ടറിൽ ഒരു മീറ്റിംഗ് ബുക്ക് ചെയ്യാനോ കഴിയില്ല.
ടൂൾ കോളിംഗ് (Tool calling) ഇത് മാറ്റുന്നു. ഇത് ഒരു AI മോഡലിന് കൈകളും കണ്ണുകളും നൽകുന്നു.
ഇത് എങ്ങനെ പ്രവർത്തിക്കുന്നു:
ഡെവലപ്പർമാർ മോഡലിന് ചില ടൂളുകൾ നൽകുന്നു. കാൽക്കുലേറ്റർ, സെർച്ച് എഞ്ചിൻ അല്ലെങ്കിൽ ഒരു ഡാറ്റാബേസ് പോലുള്ള API-കളാണ് ഈ ടൂളുകൾ.
വെറുതെ ടെക്സ്റ്റ് എഴുതുന്നതിന് പകരം, മോഡൽ ഒരു ലൂപ്പ് (loop) പിന്തുടരുന്നു:
• ചിന്താശേഷി (Reasoning): മോഡൽ നിങ്ങളുടെ അഭ്യർത്ഥന വായിക്കുന്നു. • പ്രവർത്തനം (Action): ഒരു ടൂൾ ആവശ്യമാണെന്ന് മോഡൽ തീരുമാനിക്കുന്നു. അത് ടൂളിലേക്ക് ഒരു സ്ട്രക്ചർഡ് റിക്വസ്റ്റ് (JSON പോലുള്ളവ) അയക്കുന്നു. • നിരീക്ഷണം (Observation): ടൂൾ ആ ജോലി ചെയ്യുന്നു, തുടർന്ന് ഡാറ്റ തിരികെ അയക്കുന്നു. • പ്രതികരണം (Response): ആ പുതിയ ഡാറ്റ ഉപയോഗിച്ച് മോഡൽ നിങ്ങൾക്ക് അന്തിമ ഉത്തരം നൽകുന്നു.
ഉദാഹരണം:
നിങ്ങൾ "ഇന്ന് ഓസ്റ്റിനിൽ (Austin) എനിക്ക് ഒരു ജാക്കറ്റ് ആവശ്യമുണ്ടോ?" എന്ന് ചോദിച്ചാൽ, മോഡൽ വെറുതെ ഊഹിച്ചു പറയില്ല.
- അത് ഒരു വെതർ ടൂൾ (weather tool) തിരിച്ചറിയുന്നു.
- അത് "Austin, TX" എന്ന ലൊക്കേഷൻ ആ ടൂളിലേക്ക് അയക്കുന്നു.
- അത് നിലവിലെ താപനില സ്വീകരിക്കുന്നു.
- അത് നിങ്ങളോട് പറയുന്നു, "താപനില 58 ഡിഗ്രിയാണ്, കാറ്റും ഉണ്ട്, അതിനാൽ ഒരു ജാക്കറ്റ് കരുതുക."
ഇത് ഒരു നിഷ്ക്രിയമായ (passive) ചാറ്റ്ബോട്ടിനെ സജീവമായ (active) ഒരു ഏജന്റാക്കി മാറ്റുന്നു.
ഇതിന്റെ രഹസ്യം വിവരണത്തിലാണ് (description). നിങ്ങൾ ഒരു ടൂളിന് അവ്യക്തമായ പേര് നൽകിയാൽ, മോഡൽ പരാജയപ്പെടും. എന്നാൽ വ്യക്തവും കൃത്യവുമായ ഒരു വിവരണം നൽകിയാൽ, അത് എപ്പോൾ ഉപയോഗിക്കണമെന്ന് മോഡലിന് കൃത്യമായി അറിയാൻ സാധിക്കും.
ഇത്തരം സിസ്റ്റങ്ങൾ നിർമ്മിക്കുമ്പോൾ മൂന്ന് കാര്യങ്ങളിൽ ശ്രദ്ധ കേന്ദ്രീകരിക്കണം:
- വേഗത (Speed): ഓരോ ടൂൾ കോളിനും സമയം എടുക്കും. കൂടുതൽ ഘട്ടങ്ങൾ ഉണ്ടെങ്കിൽ AI പതുക്കെയാകും.
- സുരക്ഷ (Safety): ഒരു ടൂളിന് ഇമെയിലുകൾ അയക്കാനോ പണം കൈമാറാനോ കഴിയുമെങ്കിൽ, മനുഷ്യന്റെ അനുമതി (human approval) കൂടി ഉൾപ്പെടുത്തണം.
- വിശ്വാസ്യത (Reliability): API-കൾ പരാജയപ്പെട്ടേക്കാം. പിശകുകൾ (errors) കണ്ടെത്താനും മോഡലിനോട് വീണ്ടും ശ്രമിക്കാൻ ആവശ്യപ്പെടാനും കഴിയുന്ന രീതിയിൽ സിസ്റ്റങ്ങൾ നിർമ്മിക്കണം.
വാക്കുകൾക്കും പ്രവൃത്തികൾക്കും ഇടയിലുള്ള പാലമാണ് ടൂൾ കോളിംഗ്. ഇത് കൃത്യമായി പഠിച്ചാൽ മാത്രമേ യഥാർത്ഥത്തിൽ ജോലികൾ ചെയ്തുതീർക്കുന്ന AI നിർമ്മിക്കാൻ സാധിക്കൂ.
Optional learning community: https://t.me/GyaanSetuAi
