मैंने अपना खुद का AI एजेंट बनाया। यहाँ वह है जो कोई आपको नहीं बताता।
ज़्यादातर लोग AI एजेंटों के बारे में जादू की तरह बात करते हैं। मैंने एक बनाया है। यह जादू नहीं है। यह बुनियादी व्यवस्था (plumbing) है।
छह महीने पहले, मैंने AkiraAI बनाना शुरू किया। यह एक पर्सनल AI एजेंट है जो मेरे अपने सर्वर पर 24/7 चलता है। यह कोई चैटबॉट नहीं है। यह एक ऐसा एजेंट है जो मेरे ईमेल पढ़ता है, लेख प्रकाशित करता है, मेरे कैलेंडर को मैनेज करता है, और मेरे सर्वर की निगरानी करता है।
इसे बनाने से मैंने वे चीज़ें सीखीं जो कोई ट्यूटोरियल नहीं सिखा सकता।
तकनीक में अंतराल
LinkedIn और YouTube पर हर कोई agentic AI के बारे में बात करता है। लगभग कोई भी इसे शुरुआत से (from scratch) नहीं बनाता और प्रोडक्शन में नहीं चलाता। मैं उसी अंतराल में उतरा।
टूल्स एजेंट को बनाते हैं
जब मैंने पहली बार अपने एजेंट को Claude से जोड़ा, तो वह बेकार था। वह सवालों के जवाब तो दे सकता था, लेकिन काम नहीं कर सकता था।
एक एजेंट तब असली बनता है जब आप उसे टूल्स देते हैं। मैंने वेब सर्च, Gmail एक्सेस, Google Drive, और shell execution जोड़ दिए। टूल्स ही एक तोते और एक सहायक के बीच का अंतर हैं।
मेमोरी की समस्या
मुझे लगा था कि मेमोरी सरल होगी। मैं गलत था। यदि आप बहुत अधिक कॉन्टेक्स्ट (context) देते हैं, तो आप टोकन लिमिट (token limits) तक पहुँच जाते हैं। यदि आप बहुत कम देते हैं, तो एजेंट सब कुछ भूल जाता है।
मैंने एक तीन-स्तरीय सिस्टम बनाया:
- शॉर्ट-टर्म (Short-term): एक सेशन में आखिरी कुछ संदेश।
- लॉन्ग-टर्म (Long-term): मेरे प्रोजेक्ट्स और प्राथमिकताओं के तथ्यों वाली एक फ़ाइल।
- सीखे गए सबक (Lessons learned): गलतियों का एक लॉग ताकि एजेंट उन्हें दोहराए नहीं।
प्रोडक्शन कठिन है
लैपटॉप पर एजेंट चलाना आसान है। सर्वर पर इसे चलाना कठिन है। मुझे वास्तविक समस्याओं का सामना करना पड़ा:
- वेब कार्यों के दौरान RAM स्पाइक्स (spikes)।
- टाइमज़ोन (Timezone) की त्रुटियाँ जिन्होंने रिमाइंडर्स को खराब कर दिया।
- क्रैश हुए प्रोसेस और API रेट लिमिट्स।
बेहतरीन एजेंट परफेक्ट प्रॉम्प्ट्स (prompts) से नहीं बनते। वे भरोसेमंद सॉफ्टवेयर इंजीनियरिंग से बनते हैं। उन्हें वर्जनिंग (versioning), मॉनिटरिंग (monitoring), और फॉलबैक (fallbacks) की आवश्यकता होती है।
सीमाएँ निर्धारित करें
शुरुआत में मैं पूर्ण स्वायत्तता (total autonomy) चाहता था। फिर एजेंट ने लगभग एक महत्वपूर्ण सर्विस को रीस्टार्ट कर ही दिया था। मैंने सीखा कि एक स्वायत्त एजेंट बनाने का मतलब यह तय करना है कि उसे कब कार्य नहीं करना चाहिए। सीमाएँ निर्धारित करना अच्छी इंजीनियरिंग है।
परिणाम
एक सुबह, मेरी आँख एक Telegram मैसेज से खुली जो मेरे एजेंट ने भेजा था। उसने पहले ही मेरे ईमेल को फ्लैग कर दिया था, मेरे लेख प्रकाशित कर दिए थे, और मेरे सर्वर की RAM चेक कर ली थी। जब मैं सो रहा था, तब उसने काम किया।
आपके लिए मेरी सलाह:
- छोटी शुरुआत करें। एक काम चुनें और उसे अच्छी तरह से करें।
- एक बार में एक टूल जोड़ें।
- एरर लॉगिंग (error logging) और मॉनिटरिंग (monitoring) जैसे उबाऊ हिस्सों को न छोड़ें।
- इसे जितनी जल्दी हो सके प्रोडक्शन में चलाएं।
इन सिस्टम्स के काम करने के तरीके को समझने के लिए एक एजेंट बनाएं। ज़्यादातर लोग वास्तविकता जाने बिना उनके बारे में बात करते हैं। आपको उन ज़्यादातर लोगों जैसा नहीं होना चाहिए।
स्रोत: https://dev.to/mkautsar/i-built-my-own-ai-agent-heres-what-nobody-tells-you-3g31
वैकल्पिक लर्निंग कम्युनिटी: https://t.me/GyaanSetuAi