मैंने अपना खुद का AI एजेंट बनाया। यहाँ वह बातें हैं जो कोई आपको नहीं बताता।

📅3 hours ago⏱2 min read

In this article

मैंने अपना खुद का AI एजेंट बनाया। यहाँ वह है जो कोई आपको नहीं बताता।

ज़्यादातर लोग AI एजेंटों के बारे में जादू की तरह बात करते हैं। मैंने एक बनाया है। यह जादू नहीं है। यह बुनियादी व्यवस्था (plumbing) है।

छह महीने पहले, मैंने AkiraAI बनाना शुरू किया। यह एक पर्सनल AI एजेंट है जो मेरे अपने सर्वर पर 24/7 चलता है। यह कोई चैटबॉट नहीं है। यह एक ऐसा एजेंट है जो मेरे ईमेल पढ़ता है, लेख प्रकाशित करता है, मेरे कैलेंडर को मैनेज करता है, और मेरे सर्वर की निगरानी करता है।

इसे बनाने से मैंने वे चीज़ें सीखीं जो कोई ट्यूटोरियल नहीं सिखा सकता।

तकनीक में अंतराल

LinkedIn और YouTube पर हर कोई agentic AI के बारे में बात करता है। लगभग कोई भी इसे शुरुआत से (from scratch) नहीं बनाता और प्रोडक्शन में नहीं चलाता। मैं उसी अंतराल में उतरा।

टूल्स एजेंट को बनाते हैं

जब मैंने पहली बार अपने एजेंट को Claude से जोड़ा, तो वह बेकार था। वह सवालों के जवाब तो दे सकता था, लेकिन काम नहीं कर सकता था।

एक एजेंट तब असली बनता है जब आप उसे टूल्स देते हैं। मैंने वेब सर्च, Gmail एक्सेस, Google Drive, और shell execution जोड़ दिए। टूल्स ही एक तोते और एक सहायक के बीच का अंतर हैं।

मेमोरी की समस्या

मुझे लगा था कि मेमोरी सरल होगी। मैं गलत था। यदि आप बहुत अधिक कॉन्टेक्स्ट (context) देते हैं, तो आप टोकन लिमिट (token limits) तक पहुँच जाते हैं। यदि आप बहुत कम देते हैं, तो एजेंट सब कुछ भूल जाता है।

मैंने एक तीन-स्तरीय सिस्टम बनाया:

शॉर्ट-टर्म (Short-term): एक सेशन में आखिरी कुछ संदेश।
लॉन्ग-टर्म (Long-term): मेरे प्रोजेक्ट्स और प्राथमिकताओं के तथ्यों वाली एक फ़ाइल।
सीखे गए सबक (Lessons learned): गलतियों का एक लॉग ताकि एजेंट उन्हें दोहराए नहीं।

प्रोडक्शन कठिन है

लैपटॉप पर एजेंट चलाना आसान है। सर्वर पर इसे चलाना कठिन है। मुझे वास्तविक समस्याओं का सामना करना पड़ा:

वेब कार्यों के दौरान RAM स्पाइक्स (spikes)।
टाइमज़ोन (Timezone) की त्रुटियाँ जिन्होंने रिमाइंडर्स को खराब कर दिया।
क्रैश हुए प्रोसेस और API रेट लिमिट्स।

बेहतरीन एजेंट परफेक्ट प्रॉम्प्ट्स (prompts) से नहीं बनते। वे भरोसेमंद सॉफ्टवेयर इंजीनियरिंग से बनते हैं। उन्हें वर्जनिंग (versioning), मॉनिटरिंग (monitoring), और फॉलबैक (fallbacks) की आवश्यकता होती है।

सीमाएँ निर्धारित करें

शुरुआत में मैं पूर्ण स्वायत्तता (total autonomy) चाहता था। फिर एजेंट ने लगभग एक महत्वपूर्ण सर्विस को रीस्टार्ट कर ही दिया था। मैंने सीखा कि एक स्वायत्त एजेंट बनाने का मतलब यह तय करना है कि उसे कब कार्य नहीं करना चाहिए। सीमाएँ निर्धारित करना अच्छी इंजीनियरिंग है।

परिणाम

एक सुबह, मेरी आँख एक Telegram मैसेज से खुली जो मेरे एजेंट ने भेजा था। उसने पहले ही मेरे ईमेल को फ्लैग कर दिया था, मेरे लेख प्रकाशित कर दिए थे, और मेरे सर्वर की RAM चेक कर ली थी। जब मैं सो रहा था, तब उसने काम किया।

आपके लिए मेरी सलाह:

छोटी शुरुआत करें। एक काम चुनें और उसे अच्छी तरह से करें।
एक बार में एक टूल जोड़ें।
एरर लॉगिंग (error logging) और मॉनिटरिंग (monitoring) जैसे उबाऊ हिस्सों को न छोड़ें।
इसे जितनी जल्दी हो सके प्रोडक्शन में चलाएं।

इन सिस्टम्स के काम करने के तरीके को समझने के लिए एक एजेंट बनाएं। ज़्यादातर लोग वास्तविकता जाने बिना उनके बारे में बात करते हैं। आपको उन ज़्यादातर लोगों जैसा नहीं होना चाहिए।

स्रोत: https://dev.to/mkautsar/i-built-my-own-ai-agent-heres-what-nobody-tells-you-3g31

वैकल्पिक लर्निंग कम्युनिटी: https://t.me/GyaanSetuAi

मैंने अपना खुद का AI एजेंट बनाया। यहाँ वह बातें हैं जो कोई आपको नहीं बताता।

तकनीक में अंतराल

टूल्स एजेंट को बनाते हैं

मेमोरी की समस्या

प्रोडक्शन कठिन है

सीमाएँ निर्धारित करें

परिणाम

Continue reading

अपना पहला डेवलपर एजेंट बनाना

AI आर्किटेक्चर बनाने का सही तरीका

एक ऑटोनॉमस एजेंट टीम बनाना

मैं ऐसी AI उपयोग नीतियां कैसे बनाता हूँ जिनका लोग वास्तव में पालन करते हैं

एआई एजेंट वास्तव में किसके लिए है?