AI एजेंट टूलिंग का विस्फोट
AI एजेंट तेज़ी से आगे बढ़ रहे हैं। एक हफ्ते लोग चैट के बारे में बात करते हैं। अगले ही हफ्ते वे ऐसे एजेंटों के बारे में बात करते हैं जो आपके सोते समय फीचर्स (features) डिलीवर कर देते हैं।
हाल ही में एक नए प्लगइन ने तीन हफ्तों में 73,000 GitHub स्टार्स हासिल किए। यह केवल हाइप (hype) नहीं है। यह सॉफ्टवेयर बनाने के हमारे तरीके में एक बदलाव है।
मैंने सबसे लोकप्रिय ओपन-सोर्स एजेंट टूल्स का अध्ययन किया। अकेले पांच प्रोजेक्ट्स के पास लगभग 500,000 स्टार्स हैं। वे एक-दूसरे के प्रतिस्पर्धी नहीं हैं। वे एक ही समस्या के अलग-अलग हिस्सों को हल करते हैं।
यहाँ डेटा है:
• obra/superpowers: 245,614 stars. एजेंट स्किल्स और कार्यप्रणाली (methodology) के लिए एक फ्रेमवर्क। • thedotmack/claude-mem: 85,713 stars. एजेंटों के लिए परसिस्टेंट मेमोरी (persistent memory)। • bytedance/deer-flow: 76,027 stars. रिसर्च और कोडिंग के लिए टूल्स। • DietrichGebert/ponytail: 73,143 stars. एजेंटों को सीनियर डेवलपर्स की तरह सोचने के काबिल बनाता है। • cobusgreyling/loop-engineering: नया। एक इंजीनियरिंग लूप फ्रेमवर्क।
ये टूल्स हमें पांच सबक सिखाते हैं:
कम कोड लिखें। अधिकांश टूल्स मात्रा (volume) पर ध्यान केंद्रित करते हैं। वे जितना संभव हो सके उतना कोड जेनरेट करना चाहते हैं। बेहतरीन टूल्स वैल्यू (value) पर ध्यान केंद्रित करते हैं। Ponytail नामक एक टूल एजेंटों को आलसी सीनियर डेवलपर्स की तरह काम करना सिखाता है। यह कोड लिखने से पहले पूछता है कि क्या बदलाव आवश्यक है। सबसे तेज़ कोड वह है जिसे आप कभी लिखते ही नहीं।
स्ट्रक्चर स्मार्ट मॉडल्स से बेहतर है। आप किसी एजेंट से सिर्फ एक फीचर बनाने के लिए नहीं कह सकते। आपको एक प्रक्रिया की आवश्यकता होती है। सफल टूल्स एक स्ट्रक्चर्ड लाइफसाइकिल का उपयोग करते हैं:
- Spec: क्या बनाना है, उसे परिभाषित करें।
- Plan: काम को चरणों में विभाजित करें।
- Implement: चरण-दर-चरण कोड लिखें।
- Review: रिव्यू को ऑटोमेट करें।
- Refactor: निष्कर्षों के आधार पर सुधार करें।
एजेंटों को मेमोरी की आवश्यकता होती है। स्टैंडर्ड एजेंट भूल जाते हैं कि उन्होंने पांच मिनट पहले क्या किया था। Claude-mem जैसे टूल्स एजेंटों को एक दिमाग देते हैं। वे अलग-अलग सेशन्स में प्रोजेक्ट पैटर्न और निर्णयों को स्टोर करते हैं। यह आपको अपनी बातों को दोहराने से रोकता है।
मिडिल लेयर्स (middle layers) पर ध्यान दें। सिर्फ यह न पूछें कि किस एजेंट का उपयोग करना है। असली वैल्यू स्टैक के बीच में होती है:
- Skills: एजेंट कैसे व्यवहार करता है।
- Memory: वह कैसे याद रखता है।
- Orchestration: वह कार्यों को कैसे मैनेज करता है।
- सुरक्षा एक बड़ा जोखिम है। कई एजेंट अपने सिस्टम प्रॉम्प्ट्स (system prompts) लीक कर देते हैं। यदि आपके एजेंट के पास कोड या क्रेडेंशियल्स (credentials) का एक्सेस है, तो यह खतरनाक है। सैंडबॉक्स्ड एनवायरनमेंट (sandboxed environments) का उपयोग करें और एजेंटों को केवल न्यूनतम आवश्यक एक्सेस ही दें।
भविष्य एक अकेला सुपर-एजेंट नहीं है। भविष्य एक साथ काम करने वाले टूल्स के स्टैक का है।
वैकल्पिक लर्निंग कम्युनिटी: https://t.me/GyaanSetuAi
