LLM + RAG + Function Calling म्हणजे AI Agent नाही

अनेक लोक कोणत्याही AI ॲप्लिकेशनला 'एजंट' (agent) म्हणतात. जेव्हा ते RAG आणि function calling वापरणारा LLM पाहतात, तेव्हा ते त्याला हा लेबल लावतात.

हे चुकीचे आहे.

ही साधने क्षमता (capability) प्रदान करतात. ती स्वायत्तता (autonomy) प्रदान करत नाहीत. स्वायत्ततेशिवाय, तुमच्याकडे एजंट नाही.

एखादी प्रणाली काय करू शकते आणि ती कशी वागते, या दोन गोष्टी वेगळ्या करणे आवश्यक आहे.

LLM संदर्भावरून (context) मजकूर तयार करते. ते प्रणालीचा प्रवाह (flow) नियंत्रित करत नाही.

RAG उत्तरे सुधारण्यासाठी माहिती मिळवते. ते नियोजन करत नाही किंवा निर्णय घेत नाही.

Function calling मॉडेलला कृतीची विनंती (request) करण्याची परवानगी देते. कोणते फंक्शन्स उपलब्ध आहेत आणि ते कधी चालवायचे, याचा निर्णय तरीही प्रणालीच घेते. मॉडेल फक्त विनंती करते.

तुम्ही या तिन्हींना एकत्र करू शकता, तरीही तुमच्याकडे एजंट नसू शकतो. तुमच्याकडे कृतींच्या क्रमावर (sequence of actions) नियंत्रण नसते.

बहुतेक सध्याची ॲप्लिकेशन्स पूर्वनिर्धारित पाइपलाइन (predefined pipeline) वापरतात. कोड ठरवतो:

  • RAG कधी वापरायचे
  • LLM ला कधी कॉल करायचे
  • फंक्शन कधी ट्रिगर करायचे
  • अंतिम निकाल कसा प्रोसेस करायचा

हा एक मर्यादित वर्कफ्लो (bounded workflow) आहे. मॉडेल एका ठरलेल्या मार्गावर काम करते. ते एका क्रमाचे पालन करते आणि नंतर थांबते. ते नियोजन करत नाही.

AI एजंट वेगळ्या पद्धतीने काम करतो. तो ठरलेल्या मार्गाचे पालन करत नाही. प्रक्रियेदरम्यान काय घडते, यावर आधारित तो पुढचे पाऊल ठरवतो.

एक मानक प्रणाली (standard system) सांगते: हा वर्कफ्लो फॉलो करा. एक एजंट प्रणाली सांगते: हे ध्येय (goal) साध्य करा.

एजंट त्याच्या वर्तनावरून (behavior) ओळखला जातो, त्याच्या साधनांवरून नाही. एजंटने खालील गोष्टी करणे आवश्यक आहे:

  • पुढची कृती ठरवणे
  • साधने डायनॅमिकली (dynamically) निवडणे
  • अनेक पायऱ्यांमधून प्रक्रिया करणे (iterate)
  • निकालांच्या आधारे रणनीती बदलणे
  • ध्येय गाठेपर्यंत प्रक्रिया सुरू ठेवणे

हा फरक जबाबदारीचा (responsibility) आहे.

LLM ॲप्लिकेशनमध्ये, प्रणाली मॉडेलला काय करायचे ते सांगते. एजंटमध्ये, प्रणाली मॉडेलला ध्येय सांगते. ते ध्येय कसे गाठायचे याचा निर्णय मॉडेल घेते.

RAG संदर्भ (context) प्रदान करते. Function calling कृती सक्षम करते. LLMs तर्कशक्ती (reasoning) प्रदान करतात.

परंतु, एजंट तेव्हाच अस्तित्वात असतो जेव्हा मॉडेल स्वतःच्या कृतींच्या क्रमावर नियंत्रण ठेवते.

Source: https://dev.to/rohith_kn/llm-rag-function-calling-is-not-an-ai-agent-5459

Optional learning community: https://t.me/GyaanSetuAi