LLM + RAG + Function Calling म्हणजे AI Agent नाही

अनेक लोक LLM, RAG आणि function calling वापरणाऱ्या कोणत्याही ॲप्लिकेशनला AI agent म्हणतात.

हे चुकीचे आहे.

ही साधने क्षमता (capability) वाढवतात. ती स्वायत्तता (autonomy) देत नाहीत. स्वायत्ततेशिवाय, तुमच्याकडे agent नसतो.

ही गोंधळलेली स्थिती निर्माण होते कारण लोक सिस्टमची क्षमता (capability) आणि सिस्टमचे वर्तन (behavior) यामध्ये गल्लत करतात.

या घटकांच्या भूमिका पहा:

  • LLMs संदर्भाच्या (context) आधारे प्रतिसाद तयार करतात. ते सिस्टमच्या प्रवाहावर (flow) नियंत्रण ठेवत नाहीत.
  • RAG संबंधित डेटा मिळवते. ते संदर्भ प्रदान करते परंतु निर्णय घेत नाही किंवा पावले (steps) आखत नाही.
  • Function calling मुळे LLM कृतींसाठी विनंती करू शकते. कोणते functions उपलब्ध आहेत आणि ते कधी चालवायचे, याचा निर्णय तरीही सिस्टमच घेते.

जेव्हा तुम्ही या तिन्हींचे एकत्रिकरण करता, तेव्हाही सिस्टममध्ये एक्झिक्यूशन फ्लोवर (execution flow) नियंत्रण नसते.

बहुतेक सेटअपमध्ये, ॲप्लिकेशन एका पूर्वनिर्धारित पाइपलाइनचे (predefined pipeline) अनुसरण करते. कोड ठरवतो:

  • RAG कधी वापरायचे.
  • LLM ला कधी कॉल करायचे.
  • Function कधी ट्रिगर करायचे.
  • प्रतिसाद कसा परत करायचा.

हा एक मर्यादित वर्कफ्लो (bounded workflow) आहे. मॉडेल एका ठरलेल्या मार्गाचे अनुसरण करते आणि नंतर थांबते. ते स्वतःहून नियोजन किंवा पुनरावृत्ती (iterate) करत नाही.

AI agent वेगळ्या पद्धतीने काम करतो. तो कोणत्याही ठराविक क्रमाचे (fixed sequence) पालन करत नाही. प्रक्रियेदरम्यान काय घडते, यावर आधारित तो आपले पुढचे पाऊल ठरवतो.

फरक साधा आहे:

  • नॉन-एजंट सिस्टम वर्कफ्लोचे अनुसरण करते.
  • एजंट सिस्टम ध्येयाचा (goal) पाठपुरावा करते.

एजंटची व्याख्या त्याच्या वर्तनावरून होते, साधनांवरून नाही. एजंटमध्ये खालील क्षमता असणे आवश्यक आहे:

  • पुढची कृती निवडणे.
  • साधने डायनॅमिकली (dynamically) निवडणे.
  • लूपमध्ये अनेक पावले चालवणे.
  • नवीन निकालांच्या आधारे आपली योजना बदलणे.
  • ध्येय गाठेपर्यंत काम करणे.

जबाबदारीचा विचार करा.

LLM ॲप्लिकेशनमध्ये, सिस्टम मॉडेलला काय करायचे आहे ते सांगते.

एजंटमध्ये, सिस्टम मॉडेलला ध्येय (goal) सांगते. ते ध्येय कसे गाठायचे याचा निर्णय मॉडेल स्वतः घेते.

RAG संदर्भ सुधारते. Function calling कृती सक्षम करते. LLMs तर्कसंगत विचार (reasoning) प्रदान करतात. यांपैकी कोणतेही साधन एकट्याने एजंट तयार करू शकत नाही.

जेव्हा मॉडेल स्वतःच्या कृतींच्या क्रमावर नियंत्रण ठेवते, तेव्हाच एजंट अस्तित्वात येतो.

स्त्रोत: https://dev.to/rohith_kn/llm-rag-function-calling-is-not-an-ai-agent-5459