LLM + RAG + Function Calling एक AI Agent नहीं है

बहुत से लोग किसी भी AI एप्लिकेशन को एजेंट कह देते हैं। वे एक LLM को RAG और function calling का उपयोग करते हुए देखते हैं और उसे यह लेबल दे देते हैं।

यह गलत है।

ये टूल्स क्षमता (capability) प्रदान करते हैं। ये स्वायत्तता (autonomy) प्रदान नहीं करते। स्वायत्तता के बिना, आपके पास कोई एजेंट नहीं है।

आपको यह अलग करना होगा कि एक सिस्टम क्या कर सकता है और वह कैसे व्यवहार करता है।

एक LLM संदर्भ (context) से टेक्स्ट जेनरेट करता है। यह सिस्टम के प्रवाह (flow) को नियंत्रित नहीं करता है।

RAG उत्तरों को बेहतर बनाने के लिए जानकारी प्राप्त करता है। यह योजना नहीं बनाता या निर्णय नहीं लेता है।

Function calling एक मॉडल को किसी एक्शन के लिए अनुरोध करने की अनुमति देता है। सिस्टम अभी भी यह तय करता है कि कौन से फंक्शन्स मौजूद हैं और उन्हें कब चलाना है। मॉडल केवल अनुरोध करता है।

आप इन तीनों को मिला सकते हैं और फिर भी आपके पास एजेंट की कमी हो सकती है। आपके पास एक्शन के क्रम (sequence of actions) पर नियंत्रण की कमी है।

अधिकांश वर्तमान एप्लिकेशन एक पूर्व-निर्धारित (predefined) पाइपलाइन का उपयोग करते हैं। कोड तय करता है:

  • कब RAG का उपयोग करना है
  • LLM को कब कॉल करना है
  • फंक्शन को कब ट्रिगर करना है
  • अंतिम परिणाम को कैसे प्रोसेस करना है

यह एक सीमित वर्कफ़्लो (bounded workflow) है। मॉडल एक निर्धारित पथ के भीतर काम करता है। यह एक क्रम का पालन करता है और फिर रुक जाता है। यह योजना नहीं बनाता है।

एक AI एजेंट अलग तरह से काम करता है। यह किसी निर्धारित पथ का पालन नहीं करता है। यह प्रक्रिया के दौरान क्या होता है, उसके आधार पर अगला कदम तय करता है।

एक मानक सिस्टम कहता है: इस वर्कफ़्लो का पालन करें। एक एजेंट सिस्टम कहता है: इस लक्ष्य (goal) को हल करें।

एक एजेंट को उसके व्यवहार से परिभाषित किया जाता है, उसके टूल्स से नहीं। एक एजेंट को चाहिए:

  • अगला एक्शन तय करना
  • गतिशील रूप से (dynamically) टूल्स चुनना
  • कई चरणों के माध्यम से आगे बढ़ना (iterate करना)
  • परिणामों के आधार पर रणनीति बदलना
  • लक्ष्य प्राप्त करने तक जारी रखना

अंतर जिम्मेदारी (responsibility) का है।

एक LLM एप्लिकेशन में, सिस्टम मॉडल को बताता है कि क्या करना है। एक एजेंट में, सिस्टम मॉडल को लक्ष्य बताता है। मॉडल तय करता है कि वहां तक कैसे पहुंचना है।

RAG संदर्भ (context) प्रदान करता है। Function calling एक्शन को सक्षम बनाता है। LLMs तर्क (reasoning) प्रदान करते हैं।

लेकिन एक एजेंट तभी अस्तित्व में होता है जब मॉडल अपने स्वयं के एक्शन के क्रम को नियंत्रित करता है।

Source: https://dev.to/rohith_kn/llm-rag-function-calling-is-not-an-ai-agent-5459

Optional learning community: https://t.me/GyaanSetuAi