द फुल एजेंटिक स्टॅक मॅनिफेस्टो

Translated for your language. Read the original.

AI-assisted draft.

१५ तासांपूर्वी2min read

In this article

𝗧𝗵𝗲 𝗙𝘂𝗹𝗹𝗔𝗴𝗲𝗻𝘁𝗶𝗰𝗦𝘁𝗮𝗰𝗸 𝗠𝗮𝗻𝗶𝗳𝗲𝘀𝘁𝗼

प्रत्येकजण एजंट्स (agents) तयार करण्याचा प्रयत्न करत आहे.

लोक प्रॉम्प्ट्स (prompts), टूल्स (tools) आणि LLMs बद्दल बोलतात. त्यांचे लक्ष एजंट्सद्वारे APIs कॉल करण्यावर असते. ही तर फक्त सुरुवात आहे.

काही वर्षांत प्रश्न बदलून जाईल. तुम्ही एजंट कसा तयार करायचा हे विचारणार नाही. तर एजंट्सपासून बनलेली विश्वसनीय प्रणाली (systems) कशी तयार करायची, हे विचाराल.

एजंट ही एक प्रणाली नाही. एजंट हा एका मोठ्या आर्किटेक्चरचा (architecture) एक भाग आहे.

सॉफ्टवेअरच्या पुढील टप्प्यासाठी इन्फ्रास्ट्रक्चरची (infrastructure) गरज आहे. एजंट्स, मानव आणि सेवांनी विश्वास, मेमरी आणि पुराव्यांसह एकमेकांशी संवाद साधणे आवश्यक आहे. मी याला FullAgenticStack म्हणतो.

एजंट तयार करणे सोपे होत आहे. यामुळे एक सापळा तयार होतोय. लोकांना वाटते की 'एजेंटिक सॉफ्टवेअर' म्हणजे फक्त एक LLM आणि त्यासोबत टूल्स आणि मेमरी.

ते पुरेसे नाही.

टूल कॉलिंग (tool calling) असलेला चॅटबॉट ही एक प्रणाली नाही. प्रॉम्प्ट्सची साखळी (chain of prompts) हे आर्किटेक्चर नाही.

खरी समस्या एजंटला एकदा एखादे काम करून घेणे ही नाही. खरी समस्या एजंट्सच्या प्रणालींना वास्तविक जगात सुरक्षितपणे आणि वारंवार काम करायला लावणे ही आहे.

तुम्हाला या प्रश्नांची उत्तरे द्यावी लागतील:

तुम्ही एजंट्सचे ऑर्केस्ट्रेशन (orchestrate) कसे करता?
तुम्ही त्यांचे प्रमाणीकरण (authenticate) कसे करता?
तुम्ही त्यांच्या कृतींचे ऑडिट (audit) कसे करता?
तुम्ही त्यांच्या परवानग्या (permissions) कशा मर्यादित करता?
अपयशानंतर तुम्ही स्थिती (state) कशी पूर्ववत करता?
जेव्हा एजंट्स समन्वय साधतात, तेव्हा तुम्ही गोंधळ कसा टाळता?

या लहान समस्या नाहीत. ते पाया आहेत.

FullAgenticStack एजेंटिक सॉफ्टवेअरला प्रोडक्शनमध्ये (production) काम करण्यासाठी आवश्यक वातावरण प्रदान करते. यामध्ये खालील गोष्टींचा समावेश होतो:

मानव आणि एजंटची ओळख (identity)
प्रमाणीकरण (authentication) आणि अधिकृतता (authorization)
परवानग्या (permissions) आणि क्षमता (capabilities)
स्थिती (state) आणि मेमरी (memory)
इव्हेंट हिस्ट्री (event history) आणि ऑब्झर्व्हेबिलिटी (observability)
रिकव्हरी (recovery) आणि रोलबॅक (rollback)
अंमलबजावणीचा पुरावा (proof of execution)
झिरो-ट्रस्ट इंटरअॅक्शन (Zero-trust interaction)

टूल कॉलिंग हे केवळ एक इंटरफेस आहे. ते ओळखीची (identity) समस्या सोडवत नाही. ते जबाबदारीची समस्या सोडवत नाही.

जर एखाद्या एजंटने उत्पादन खरेदी केले, तर त्याला कोणी अधिकृत केले? जर एखादा एजंट अपयशी ठरला, तर तुम्ही परिस्थिती कशी हाताळाल? जर एखाद्या एजंटमुळे नुकसान झाले, तर काय घडले याचा तुम्ही पुरावा कसा द्याल?

या अभियांत्रिकी आवश्यकता (engineering requirements) आहेत.

पुढील वेबमध्ये लोक आणि कंपन्यांसाठी काम करणारे एजंट्स असतील. एजंट्स वाटाघाटी करतील, वेळापत्रक ठरवतील, खरेदी आणि विक्री करतील.

हे यशस्वी होण्यासाठी, एजंट्स हे अदृश्य स्क्रिप्ट्स असू शकत नाहीत. ते ओळखण्यायोग्य, निरीक्षण करण्यायोग्य आणि सिद्ध करण्यायोग्य असणे आवश्यक आहे.

तुम्हाला प्रॉम्प्ट स्टॅकची गरज नाही. तुम्हाला FullAgenticStack ची गरज आहे.

केवळ वरवर पाहणे थांबवा. ध्येय हे नाही की एजंट एखादे टूल कॉल करू शकतो की नाही. ध्येय हे आहे की एजंट एका विश्वासार्ह प्रणालीमध्ये अस्तित्वात राहू शकतो की नाही.

एजंट्स हे शेवट नाहीत. ते एका नवीन आर्किटेक्चरची सुरुवात आहेत.

The FullAgenticStack मॅनिफेस्टो: एजंट्स म्हणजे केवळ LLMs नाहीत

आजच्या काळात, जेव्हा आपण "एजंट" (Agent) हा शब्द वापरतो, तेव्हा अनेकांच्या मनात केवळ एक प्रगत चॅटबॉट किंवा LLM (Large Language Model) ची प्रतिमा येते. परंतु, हे एक मोठे गैरसमज आहे.

एजंट = LLM नाही.

LLM हा एजंटचा केवळ एक भाग आहे—तो त्याचा 'मेंदू' किंवा 'तर्कशक्ती इंजिन' (Reasoning Engine) आहे. एक खरा एजंट तयार करण्यासाठी आपल्याला केवळ एका मॉडेलची गरज नसते, तर आपल्याला एका संपूर्ण प्रणालीची (System) गरज असते.

यालाच आम्ही The FullAgenticStack म्हणतो.

एजंटचे मुख्य घटक (Core Components of an Agent)

एका कार्यक्षम एजंटमध्ये खालील चार महत्त्वाचे स्तंभ असणे आवश्यक आहे:

१. तर्कशक्ती (Reasoning)

LLM एजंटला विचार करण्याची क्षमता देते. हे केवळ मजकूर तयार करण्यापुरते मर्यादित नाही, तर समस्यांचे विश्लेषण करणे, तर्क लावणे आणि पुढील पाऊल काय असावे हे ठरवणे यासाठी याचा वापर होतो.

२. मेमरी (Memory)

एका साध्या चॅटबॉटप्रमाणे केवळ संवादाचा संदर्भ लक्षात ठेवणे म्हणजे मेमरी नाही. एजंटला दोन प्रकारच्या मेमरीची आवश्यकता असते:

Short-term Memory (अल्पकालीन मेमरी): सध्याच्या कार्याचा संदर्भ आणि संवादाचा प्रवाह लक्षात ठेवण्यासाठी.
Long-term Memory (दीर्घकालीन मेमरी): मागील अनुभव, वापरकर्त्याच्या आवडीनिवडी आणि ऐतिहासिक डेटा साठवण्यासाठी (सहसा Vector Databases चा वापर करून).

३. नियोजन (Planning)

जटिल कार्ये (Complex tasks) पूर्ण करण्यासाठी एजंटला त्याचे लहान, व्यवस्थापित करण्यायोग्य भागांत विभाजन करावे लागते. यामध्ये 'Chain of Thought' किंवा 'Tree of Thoughts' सारख्या तंत्रांचा समावेश होतो, ज्यामुळे एजंट स्वतःच्या कृतींचे नियोजन करू शकतो.

४. साधनांचा वापर (Tool Use / Action)

केवळ बोलणे पुरेसे नाही; एजंटला कृती करणे आवश्यक आहे. यामध्ये खालील गोष्टींचा समावेश असू शकतो:

API कॉल करणे.
वेब ब्राउझिंग करणे.
कोड रन करणे.
डेटाबेसशी संवाद साधणे.

वातावरण आणि फीडबॅक लूप (Environment & Feedback Loop)

एजंट हा एका बंद खोलीत काम करत नाही. तो एका वातावरणात (Environment) काम करतो. जेव्हा एजंट एखादी कृती करतो, तेव्हा त्यातून मिळणारा प्रतिसाद (Feedback) त्याच्या पुढील निर्णयावर परिणाम करतो.

ही एक निरंतर चालणारी प्रक्रिया आहे: Perception (निरीक्षण) $\rightarrow$ Reasoning (तर्क) $\rightarrow$ Action (कृती) $\rightarrow$ Observation (निरीक्षण)

या चक्रामुळेच एजंट स्वतःच्या चुका सुधारू शकतो आणि बदलत्या परिस्थितीनुसार स्वतःला जुळवून घेऊ शकतो.

निष्कर्ष

जर तुम्हाला खरोखरच स्वायत्त (Autonomous) एजंट्स तयार करायचे असतील, तर तुम्हाला केवळ 'प्रॉम्प्ट इंजिनिअरिंग'वर लक्ष केंद्रित करून चालणार नाही. तुम्हाला मेमरी, प्लॅनिंग, टूल्स आणि फीडबॅक लूप्स एकत्रित करणारी एक संपूर्ण प्रणाली किंवा 'स्टॅक' तयार करावा लागेल.

एजंट्स हे केवळ बोलणारे मॉडेल्स नाहीत; ते काम करणारे सिस्टिम्स आहेत.

अधिक माहितीसाठी आणि एआय (AI) समुदायाशी जोडले जाण्यासाठी खालील लिंकला भेट द्या: Optional learning community: https://t.me/GyaanSetuAi

द फुल एजेंटिक स्टॅक मॅनिफेस्टो

The FullAgenticStack मॅनिफेस्टो: एजंट्स म्हणजे केवळ LLMs नाहीत

एजंटचे मुख्य घटक (Core Components of an Agent)

१. तर्कशक्ती (Reasoning)

२. मेमरी (Memory)

३. नियोजन (Planning)

४. साधनांचा वापर (Tool Use / Action)

वातावरण आणि फीडबॅक लूप (Environment & Feedback Loop)

निष्कर्ष

Continue reading

FullAgenticStack म्हणजे काय?

𝗪𝗵𝗮𝘁 𝗶𝘀 𝗙𝘂𝗹𝗹𝗔𝗴𝗲𝗻𝘁𝗶𝗰𝗦𝘁𝗮𝗰𝗸?

प्रॉम्प्ट्सपासून एआय एजंट्सपर्यंत: फ्रंटएंड डेव्हलपरसाठी एक मार्गदर्शक

प्रॉम्प्ट्सपासून AI एजंट्सपर्यंत: फ्रंटएंड डेव्हलपरसाठी एक मार्गदर्शक

𝗧𝗵𝗲 𝗙𝘂𝗹𝗹𝗔𝗴𝗲𝗻𝘁𝗶𝗰𝗦𝘁𝗮𝗰𝗸 𝗠𝗮𝗻𝗶𝗳𝗲𝘀𝘁𝗼