AI एजंट्स म्हणजे काय?
मी एकदा ChatGPT ला इस्तंबूलच्या सहलीचे नियोजन करण्यास सांगितले. त्याने मला एक उत्तम प्लॅन दिला. पण तो विमाने बुक करू शकला नाही. तो हॉटेलचे दर तपासू शकला नाही. तो ईमेल पाठवू शकला नाही.
मॉडेल हुशार होते, पण त्याला 'हात' नव्हते. ते विचार करू शकत होते, पण कृती करू शकत नव्हते.
AI एजंट्स ही समस्या सोडवतात.
स्टँडर्ड LLMs (Large Language Models) एका सुशिक्षित सहाय्यकाप्रमाणे काम करतात. तुम्ही एक प्रॉम्प्ट पाठवता आणि मॉडेल प्रतिसाद देते. हा एक 'सिंगल राउंड ट्रिप' आहे. मॉडेल वेब ब्राउझ करत नाही, तुमचे कॅलेंडर तपासत नाही किंवा वास्तविक जगात कोणतीही कृती करत नाही.
AI एजंट वेगळा असतो. एखादा एजंट ध्येय गाठण्यासाठी साधनांचा (tools) वापर कसा करायचा हे ठरवण्यासाठी लँग्वेज मॉडेलचा वापर करतो.
एखादा एजंट खालील गोष्टी करू शकतो:
- वेब सर्च करणे
- कोड रन करणे
- डेटाबेस क्वेरी करणे
- ईमेल पाठवणे
- बाह्य APIs वापरणे
मुख्य फरक म्हणजे स्वायत्तता (autonomy). तुम्ही एजंटला एक ध्येय देता आणि तो स्वतःहून त्यातील पायऱ्या ठरवतो.
तुलना: • रेग्युलर LLM: प्रश्नांची उत्तरे देते, सिंगल रिस्पॉन्स, टूल्सचा वापर नाही, रिअॅक्टिव्ह (reactive). • AI Agent: कृती करते, मल्टी-स्टेप रिझनिंग, टूल्सचा वापर करते, ध्येय-केंद्रित (goal-driven).
बहुतेक एजंट्स ReAct (Reason and Act) नावाचा पॅटर्न वापरतात. हे एका साध्या लूपचे अनुसरण करते:
- Thought (विचार): मला पुढे काय करायची गरज आहे?
- Action (कृती): एखादे टूल वापरा.
- Observe (निरीक्षण): निकालाकडे पहा.
- Repeat (पुन्हा करा): ध्येय पूर्ण होईपर्यंत प्रक्रिया सुरू ठेवा.
असे लूप तयार करणे कठीण असते. तुम्हाला त्रुटी (errors) हाताळाव्या लागतात, मेमरी मॅनेज करावी लागते आणि टूल्स एकमेकांशी जोडावे लागतात.
म्हणूनच LangChain सारखे फ्रेमवर्क्स अस्तित्वात आहेत. LangChain पायाभूत सुविधा (plumbing) पुरवते. ते तुम्हाला प्री-बिल्ट टूल्स, मेमरी आणि मॉडेल्सना वास्तविक जगाशी जोडण्याचे मार्ग देते.
जर तुमचा वर्कफ्लो गुंतागुंतीचा असेल, तर तुम्ही LangGraph वापरता. LangGraph तुम्हाला असे एजंट्स तयार करण्यास मदत करते जे वेगवेगळ्या मार्गांवर विभागले जाऊ शकतात, समांतर (parallel) कामे करू शकतात किंवा मागील पायऱ्यांवर परत जाऊ शकतात.
सारांश:
- LLMs मजकुराला (text) प्रतिसाद देतात.
- एजंट्स कामे पूर्ण करण्यासाठी टूल्स वापरतात.
- ReAct लूप एजंटच्या लॉजिकला चालवते.
- LangChain मॉडेल्स आणि टूल्समधील कनेक्शन मॅनेज करते.
- LangGraph गुंतागुंतीचे आणि फाटे फुटणारे (branching) वर्कफ्लो हाताळते.
माझ्या पुढच्या पोस्टमध्ये, मी तुम्हाला तुमचे एन्व्हायर्नमेंट (environment) कसे सेट करायचे आणि तुमचा पहिला एजंट कसा चालवायचा हे दाखवेन.
Source: https://dev.to/ikram_khan/what-are-ai-agents-a-plain-english-introduction-56nd
Optional learning community: https://t.me/GyaanSetuAi