𝗧𝗵𝗲 𝗙𝘂𝗹𝗹𝗔𝗴𝗲𝗻𝘁𝗶𝗰𝗦𝘁𝗮𝗰𝗸 𝗠𝗮𝗻𝗶𝗳𝗲𝘀𝘁𝗼

प्रत्येकजण एजंट्स (agents) तयार करण्याचा प्रयत्न करत आहे.

लोक प्रॉम्प्ट्स (prompts), टूल्स (tools) आणि LLMs बद्दल बोलतात. त्यांचे लक्ष एजंट्सद्वारे APIs कॉल करण्यावर असते. ही तर फक्त सुरुवात आहे.

काही वर्षांत प्रश्न बदलून जाईल. तुम्ही एजंट कसा तयार करायचा हे विचारणार नाही. तर एजंट्सपासून बनलेली विश्वसनीय प्रणाली (systems) कशी तयार करायची, हे विचाराल.

एजंट ही एक प्रणाली नाही. एजंट हा एका मोठ्या आर्किटेक्चरचा (architecture) एक भाग आहे.

सॉफ्टवेअरच्या पुढील टप्प्यासाठी इन्फ्रास्ट्रक्चरची (infrastructure) गरज आहे. एजंट्स, मानव आणि सेवांनी विश्वास, मेमरी आणि पुराव्यांसह एकमेकांशी संवाद साधणे आवश्यक आहे. मी याला FullAgenticStack म्हणतो.

एजंट तयार करणे सोपे होत आहे. यामुळे एक सापळा तयार होतोय. लोकांना वाटते की 'एजेंटिक सॉफ्टवेअर' म्हणजे फक्त एक LLM आणि त्यासोबत टूल्स आणि मेमरी.

ते पुरेसे नाही.

टूल कॉलिंग (tool calling) असलेला चॅटबॉट ही एक प्रणाली नाही. प्रॉम्प्ट्सची साखळी (chain of prompts) हे आर्किटेक्चर नाही.

खरी समस्या एजंटला एकदा एखादे काम करून घेणे ही नाही. खरी समस्या एजंट्सच्या प्रणालींना वास्तविक जगात सुरक्षितपणे आणि वारंवार काम करायला लावणे ही आहे.

तुम्हाला या प्रश्नांची उत्तरे द्यावी लागतील:

  • तुम्ही एजंट्सचे ऑर्केस्ट्रेशन (orchestrate) कसे करता?
  • तुम्ही त्यांचे प्रमाणीकरण (authenticate) कसे करता?
  • तुम्ही त्यांच्या कृतींचे ऑडिट (audit) कसे करता?
  • तुम्ही त्यांच्या परवानग्या (permissions) कशा मर्यादित करता?
  • अपयशानंतर तुम्ही स्थिती (state) कशी पूर्ववत करता?
  • जेव्हा एजंट्स समन्वय साधतात, तेव्हा तुम्ही गोंधळ कसा टाळता?

या लहान समस्या नाहीत. ते पाया आहेत.

FullAgenticStack एजेंटिक सॉफ्टवेअरला प्रोडक्शनमध्ये (production) काम करण्यासाठी आवश्यक वातावरण प्रदान करते. यामध्ये खालील गोष्टींचा समावेश होतो:

  • मानव आणि एजंटची ओळख (identity)
  • प्रमाणीकरण (authentication) आणि अधिकृतता (authorization)
  • परवानग्या (permissions) आणि क्षमता (capabilities)
  • स्थिती (state) आणि मेमरी (memory)
  • इव्हेंट हिस्ट्री (event history) आणि ऑब्झर्व्हेबिलिटी (observability)
  • रिकव्हरी (recovery) आणि रोलबॅक (rollback)
  • अंमलबजावणीचा पुरावा (proof of execution)
  • झिरो-ट्रस्ट इंटरअॅक्शन (Zero-trust interaction)

टूल कॉलिंग हे केवळ एक इंटरफेस आहे. ते ओळखीची (identity) समस्या सोडवत नाही. ते जबाबदारीची समस्या सोडवत नाही.

जर एखाद्या एजंटने उत्पादन खरेदी केले, तर त्याला कोणी अधिकृत केले? जर एखादा एजंट अपयशी ठरला, तर तुम्ही परिस्थिती कशी हाताळाल? जर एखाद्या एजंटमुळे नुकसान झाले, तर काय घडले याचा तुम्ही पुरावा कसा द्याल?

या अभियांत्रिकी आवश्यकता (engineering requirements) आहेत.

पुढील वेबमध्ये लोक आणि कंपन्यांसाठी काम करणारे एजंट्स असतील. एजंट्स वाटाघाटी करतील, वेळापत्रक ठरवतील, खरेदी आणि विक्री करतील.

हे यशस्वी होण्यासाठी, एजंट्स हे अदृश्य स्क्रिप्ट्स असू शकत नाहीत. ते ओळखण्यायोग्य, निरीक्षण करण्यायोग्य आणि सिद्ध करण्यायोग्य असणे आवश्यक आहे.

तुम्हाला प्रॉम्प्ट स्टॅकची गरज नाही. तुम्हाला FullAgenticStack ची गरज आहे.

केवळ वरवर पाहणे थांबवा. ध्येय हे नाही की एजंट एखादे टूल कॉल करू शकतो की नाही. ध्येय हे आहे की एजंट एका विश्वासार्ह प्रणालीमध्ये अस्तित्वात राहू शकतो की नाही.

एजंट्स हे शेवट नाहीत. ते एका नवीन आर्किटेक्चरची सुरुवात आहेत.

The FullAgenticStack मॅनिफेस्टो: एजंट्स म्हणजे केवळ LLMs नाहीत

आजच्या काळात, जेव्हा आपण "एजंट" (Agent) हा शब्द वापरतो, तेव्हा अनेकांच्या मनात केवळ एक प्रगत चॅटबॉट किंवा LLM (Large Language Model) ची प्रतिमा येते. परंतु, हे एक मोठे गैरसमज आहे.

एजंट = LLM नाही.

LLM हा एजंटचा केवळ एक भाग आहे—तो त्याचा 'मेंदू' किंवा 'तर्कशक्ती इंजिन' (Reasoning Engine) आहे. एक खरा एजंट तयार करण्यासाठी आपल्याला केवळ एका मॉडेलची गरज नसते, तर आपल्याला एका संपूर्ण प्रणालीची (System) गरज असते.

यालाच आम्ही The FullAgenticStack म्हणतो.


एजंटचे मुख्य घटक (Core Components of an Agent)

एका कार्यक्षम एजंटमध्ये खालील चार महत्त्वाचे स्तंभ असणे आवश्यक आहे:

१. तर्कशक्ती (Reasoning)

LLM एजंटला विचार करण्याची क्षमता देते. हे केवळ मजकूर तयार करण्यापुरते मर्यादित नाही, तर समस्यांचे विश्लेषण करणे, तर्क लावणे आणि पुढील पाऊल काय असावे हे ठरवणे यासाठी याचा वापर होतो.

२. मेमरी (Memory)

एका साध्या चॅटबॉटप्रमाणे केवळ संवादाचा संदर्भ लक्षात ठेवणे म्हणजे मेमरी नाही. एजंटला दोन प्रकारच्या मेमरीची आवश्यकता असते:

  • Short-term Memory (अल्पकालीन मेमरी): सध्याच्या कार्याचा संदर्भ आणि संवादाचा प्रवाह लक्षात ठेवण्यासाठी.
  • Long-term Memory (दीर्घकालीन मेमरी): मागील अनुभव, वापरकर्त्याच्या आवडीनिवडी आणि ऐतिहासिक डेटा साठवण्यासाठी (सहसा Vector Databases चा वापर करून).

३. नियोजन (Planning)

जटिल कार्ये (Complex tasks) पूर्ण करण्यासाठी एजंटला त्याचे लहान, व्यवस्थापित करण्यायोग्य भागांत विभाजन करावे लागते. यामध्ये 'Chain of Thought' किंवा 'Tree of Thoughts' सारख्या तंत्रांचा समावेश होतो, ज्यामुळे एजंट स्वतःच्या कृतींचे नियोजन करू शकतो.

४. साधनांचा वापर (Tool Use / Action)

केवळ बोलणे पुरेसे नाही; एजंटला कृती करणे आवश्यक आहे. यामध्ये खालील गोष्टींचा समावेश असू शकतो:

  • API कॉल करणे.
  • वेब ब्राउझिंग करणे.
  • कोड रन करणे.
  • डेटाबेसशी संवाद साधणे.

वातावरण आणि फीडबॅक लूप (Environment & Feedback Loop)

एजंट हा एका बंद खोलीत काम करत नाही. तो एका वातावरणात (Environment) काम करतो. जेव्हा एजंट एखादी कृती करतो, तेव्हा त्यातून मिळणारा प्रतिसाद (Feedback) त्याच्या पुढील निर्णयावर परिणाम करतो.

ही एक निरंतर चालणारी प्रक्रिया आहे: Perception (निरीक्षण) $\rightarrow$ Reasoning (तर्क) $\rightarrow$ Action (कृती) $\rightarrow$ Observation (निरीक्षण)

या चक्रामुळेच एजंट स्वतःच्या चुका सुधारू शकतो आणि बदलत्या परिस्थितीनुसार स्वतःला जुळवून घेऊ शकतो.


निष्कर्ष

जर तुम्हाला खरोखरच स्वायत्त (Autonomous) एजंट्स तयार करायचे असतील, तर तुम्हाला केवळ 'प्रॉम्प्ट इंजिनिअरिंग'वर लक्ष केंद्रित करून चालणार नाही. तुम्हाला मेमरी, प्लॅनिंग, टूल्स आणि फीडबॅक लूप्स एकत्रित करणारी एक संपूर्ण प्रणाली किंवा 'स्टॅक' तयार करावा लागेल.

एजंट्स हे केवळ बोलणारे मॉडेल्स नाहीत; ते काम करणारे सिस्टिम्स आहेत.


अधिक माहितीसाठी आणि एआय (AI) समुदायाशी जोडले जाण्यासाठी खालील लिंकला भेट द्या: Optional learning community: https://t.me/GyaanSetuAi