LLM + RAG + Function Calling एक AI Agent नहीं है
बहुत से लोग LLM, RAG और function calling का उपयोग करने वाले किसी भी एप्लिकेशन को AI agent का लेबल दे देते हैं।
यह गलत है।
ये टूल्स क्षमता (capability) बढ़ाते हैं। ये स्वायत्तता (autonomy) नहीं बढ़ाते। स्वायत्तता के बिना, आपके पास कोई एजेंट नहीं है।
यह भ्रम इसलिए पैदा होता है क्योंकि लोग सिस्टम की क्षमता (capability) को सिस्टम के व्यवहार (behavior) के साथ मिला देते हैं।
इन घटकों (components) की भूमिकाओं को देखें:
- LLMs संदर्भ (context) के आधार पर प्रतिक्रियाएं (responses) उत्पन्न करते हैं। वे सिस्टम के प्रवाह (flow) को नियंत्रित नहीं करते हैं।
- RAG प्रासंगिक डेटा (relevant data) प्राप्त करता है। यह संदर्भ प्रदान करता है लेकिन निर्णय नहीं लेता या चरणों की योजना नहीं बनाता।
- Function calling एक LLM को कार्यों (actions) का अनुरोध करने की अनुमति देता है। सिस्टम अभी भी यह तय करता है कि कौन से फंक्शन्स मौजूद हैं और उन्हें कब चलाना है।
जब आप इन तीनों को मिला भी देते हैं, तब भी सिस्टम में निष्पादन प्रवाह (execution flow) पर नियंत्रण की कमी होती है।
अधिकांश सेटअप में, एप्लिकेशन एक पूर्व-निर्धारित पाइपलाइन (predefined pipeline) का पालन करता है। कोड तय करता है:
- RAG का उपयोग कब करना है।
- LLM को कब कॉल करना है।
- किसी फंक्शन को कब ट्रिगर करना है।
- प्रतिक्रिया (response) कैसे वापस करनी है।
यह एक सीमित वर्कफ़्लो (bounded workflow) है। मॉडल एक निर्धारित पथ का अनुसरण करता है और फिर रुक जाता है। यह अपने आप योजना नहीं बनाता या दोहराव (iterate) नहीं करता।
एक AI agent अलग तरह से काम करता है। यह एक निश्चित क्रम (fixed sequence) का पालन नहीं करता है। यह प्रक्रिया के दौरान होने वाली घटनाओं के आधार पर अपना अगला कदम तय करता है।
अंतर सरल है:
- एक non-agent सिस्टम वर्कफ़्लो का पालन करता है।
- एक एजेंट सिस्टम लक्ष्य (goal) को प्राप्त करने का प्रयास करता है।
एक एजेंट की परिभाषा उसके व्यवहार से होती है, टूल्स से नहीं। एक एजेंट में ये क्षमताएं होनी चाहिए:
- अगला कार्य चुनना।
- गतिशील रूप से (dynamically) टूल्स का चयन करना।
- एक लूप में कई चरणों को चलाना।
- नए परिणामों के आधार पर अपनी योजना बदलना।
- लक्ष्य तक पहुँचने तक काम करना।
जिम्मेदारी के बारे में सोचें।
एक LLM एप्लिकेशन में, सिस्टम मॉडल को बताता है कि क्या करना है।
एक एजेंट में, सिस्टम मॉडल को लक्ष्य बताता है। मॉडल तय करता है कि उस तक कैसे पहुँचना है।
RAG संदर्भ (context) में सुधार करता है। Function calling कार्यों को सक्षम बनाता है। LLMs तर्क (reasoning) प्रदान करते हैं। इनमें से कोई भी अकेले एजेंट नहीं बनाता है।
एक एजेंट तभी अस्तित्व में होता है जब मॉडल अपने कार्यों के क्रम को स्वयं नियंत्रित करता है।
स्रोत: https://dev.to/rohith_kn/llm-rag-function-calling-is-not-an-ai-agent-5459
