AI एजंट टूलिंगचा विस्फोट
AI एजंट्स वेगाने प्रगत होत आहेत. एका आठवड्यात लोक चॅटबद्दल बोलतात, तर पुढच्या आठवड्यात तुम्ही झोपलेले असताना फीचर्स तयार करणारे एजंट्सबद्दल बोलतात.
एका नवीन प्लगइनने अलीकडेच तीन आठवड्यांत ७३,००० GitHub stars मिळवले आहेत. हा केवळ प्रचार (hype) नाही, तर आपण सॉफ्टवेअर कसे तयार करतो यातील एक मोठा बदल आहे.
मी सर्वात लोकप्रिय ओपन-सोर्स एजंट टूल्सचा अभ्यास केला. केवळ पाच प्रकल्पांना जवळजवळ ५,००,००० stars आहेत. ते एकमेकांशी स्पर्धा करत नाहीत, तर एकाच समस्येचे वेगवेगळे भाग सोडवतात.
डेटा खालीलप्रमाणे आहे:
• obra/superpowers: २४५,६१४ stars. एजंट स्किल्स आणि कार्यपद्धतीसाठी एक फ्रेमवर्क. • thedotmack/claude-mem: ८५,७१३ stars. एजंट्ससाठी पर्सिस्टंट मेमरी (Persistent memory). • bytedance/deer-flow: ७६,०२७ stars. रिसर्च आणि कोडिंगसाठी टूल्स. • DietrichGebert/ponytail: ७३,१४३ stars. एजंट्सना सिनियर डेव्हलपर्सप्रमाणे विचार करायला लावते. • cobusgreyling/loop-engineering: नवीन. एक इंजिनिअरिंग लूप फ्रेमवर्क.
ही टूल्स आपल्याला पाच धडे देतात:
कमी कोड लिहा. बहुतेक टूल्स प्रमाणावर (volume) लक्ष केंद्रित करतात. त्यांना शक्य तितका जास्त कोड जनरेट करायचा असतो. सर्वोत्तम टूल्स मूल्यावर (value) लक्ष केंद्रित करतात. 'Ponytail' नावाचे टूल एजंट्सना आळशी सिनियर डेव्हलपर्सप्रमाणे वागायला शिकवते. कोड लिहिण्यापूर्वी ते बदल आवश्यक आहे का, हे ते विचारते. सर्वात वेगवान कोड म्हणजे तो, जो तुम्हाला कधी लिहावाच लागत नाही.
स्ट्रक्चर हे स्मार्ट मॉडेल्सपेक्षा सरस आहे. तुम्ही एजंटला फक्त एखादे फीचर बनवायला सांगू शकत नाही. तुम्हाला एका प्रक्रियेची गरज आहे. यशस्वी टूल्स एका स्ट्रक्चर्ड लाइफसायकलचा वापर करतात:
- Spec: काय बनवायचे आहे ते परिभाषित करा.
- Plan: कामाचे टप्प्यांमध्ये विभाजन करा.
- Implement: टप्प्याटप्प्याने कोड लिहा.
- Review: रिव्ह्यू ऑटोमेट करा.
- Refactor: मिळालेल्या माहितीच्या आधारे सुधारणा करा.
एजंट्सना मेमरीची गरज असते. सामान्य एजंट्स पाच मिनिटांपूर्वी त्यांनी काय केले होते ते विसरतात. Claude-mem सारखी टूल्स एजंट्सना 'मेंदू' देतात. ते वेगवेगळ्या सेशन्समध्ये प्रोजेक्ट पॅटर्न आणि निर्णय साठवून ठेवतात. यामुळे तुम्हाला पुन्हा पुन्हा तेच काम करावे लागत नाही.
मध्यवर्ती स्तरांवर (middle layers) लक्ष केंद्रित करा. फक्त कोणता एजंट वापरायचा हे विचारू नका. खरी व्हॅल्यू स्टॅकच्या मध्यभागी असते:
- Skills: एजंट कसे वागतो.
- Memory: तो गोष्टी कशी लक्षात ठेवतो.
- Orchestration: तो टास्क कसे मॅनेज करतो.
- सुरक्षा हा एक मोठा धोका आहे. अनेक एजंट्स त्यांचे सिस्टम प्रॉम्प्ट्स (system prompts) लीक करतात. जर तुमच्या एजंटला कोड किंवा क्रेडेंशियल्सचा ॲक्सेस असेल, तर हे धोकादायक आहे. सँडबॉक्स एनव्हायर्नमेंट्स (sandboxed environments) वापरा आणि एजंट्सना त्यांच्या गरजेनुसार किमान ॲक्सेस द्या.
भविष्य एका 'सुपर-एजंट'चे नाही. भविष्य हे एकत्र काम करणाऱ्या टूल्सच्या स्टॅकचे आहे.
Optional learning community: https://t.me/GyaanSetuAi
