टूल कॉलिंग (Tool Calling): AI एजंट्स काय करायचे हे कसे ठरवतात

AI मॉडेल्स आता केवळ साध्या चॅटिंगच्या पलीकडे जात आहेत. ते आता प्रत्यक्ष कृती करत आहेत.

बहुतेक मॉडेल्स एका ठराविक वेळेपुरती मर्यादित असतात. त्यांना प्रशिक्षणादरम्यान (training) जे शिकवले गेले आहे, तेवढेच माहित असते. ते स्वतःहून आजचे शेअर बाजारचे भाव तपासू शकत नाहीत किंवा तुमच्या कॅलेंडरवर मीटिंग बुक करू शकत नाहीत.

टूल कॉलिंग (Tool calling) हे चित्र बदलून टाकते. हे AI मॉडेलला 'हात आणि डोळे' प्रदान करते.

हे कसे कार्य करते:

डेव्हलपर्स मॉडेलला काही टूल्सचा संच देतात. ही टूल्स कॅल्क्युलेटर, सर्च इंजिन किंवा डेटाबेस सारखी APIs असतात.

केवळ मजकूर लिहिण्याऐवजी, मॉडेल एका चक्राचा (loop) अवलंब करते:

• तर्क (Reasoning): मॉडेल तुमची विनंती वाचते. • कृती (Action): मॉडेलला ठरते की त्याला एका टूलची गरज आहे. ते टूलला एक स्ट्रक्चर्ड विनंती (उदा. JSON) पाठवते. • निरीक्षण (Observation): टूल कार्य पूर्ण करते आणि डेटा परत पाठवते. • प्रतिसाद (Response): मॉडेल त्या नवीन डेटाचा वापर करून तुम्हाला अंतिम उत्तर देते.

उदाहरण:

जर तुम्ही विचारले, "मला आज ऑस्टिनमध्ये जॅकेटची गरज आहे का?" तर मॉडेल केवळ अंदाज लावत नाही.

१. ते वेदर टूल (weather tool) ओळखते. २. ते त्या टूलला "Austin, TX" हे लोकेशन पाठवते. ३. ते सध्याचे तापमान प्राप्त करते. ४. ते तुम्हाला सांगते, "तापमान ५८ अंश आहे आणि वारा सुटला आहे, त्यामुळे जॅकेट सोबत ठेवा."

यामुळे एक निष्क्रिय (passive) चॅटबॉट एका सक्रिय (active) एजंटमध्ये रूपांतरित होतो.

याचे रहस्य वर्णनात (description) दडलेले आहे. जर तुम्ही टूलला अस्पष्ट नाव दिले, तर मॉडेल अपयशी ठरेल. जर तुम्ही त्याला स्पष्ट आणि अचूक वर्णन दिले, तर मॉडेलला ते कधी वापरायचे आहे हे नक्की समजते.

ही प्रणाली तयार करण्यासाठी तीन गोष्टींवर लक्ष केंद्रित करणे आवश्यक आहे:

  • वेग (Speed): प्रत्येक टूल कॉलसाठी वेळ लागतो. खूप जास्त पायऱ्यांमुळे AI मंद होते.
  • सुरक्षा (Safety): जर एखादे टूल ईमेल पाठवू शकत असेल किंवा पैसे ट्रान्सफर करू शकत असेल, तर तुम्हाला मानवी मंजुरी (human approval) जोडणे आवश्यक आहे.
  • विश्वासार्हता (Reliability): APIs कधीकधी निकामी होऊ शकतात. तुम्हाला अशी प्रणाली तयार करावी लागेल जी त्रुटी (errors) शोधेल आणि मॉडेलला पुन्हा प्रयत्न करण्यास सांगेल.

टूल कॉलिंग हा शब्द आणि कृती यांच्यातील दुवा आहे. यात प्रभुत्व मिळवणे म्हणजेच प्रत्यक्ष काम पूर्ण करणारे AI तयार करणे होय.

स्रोत: https://dev.to/med_stream_93ad6cad6d2bee/tool-calling-explained-how-ai-agents-decide-what-to-do-next-3n3b

पर्यायी लर्निंग कम्युनिटी: https://t.me/GyaanSetuAi