आपके एजेंट की मेमोरी शायद आपसे झूठ बोल रही है

मुझे लगा कि मेरी एजेंट मेमोरी छह महीनों तक काम कर रही थी।

इसने अलग-अलग सेशन्स में विवरण याद रखे। इसने प्रोजेक्ट्स के लिए कॉन्टेक्स्ट निकाला। इसने गलतियों को सुधारा। हर संकेत सफलता की ओर इशारा कर रहा था।

मैं गलत था।

Claude Code की अपनी इन-बिल्ट मेमोरी है। वह सिस्टम काम कर रहा था। मेरा सिस्टम चल रहा था और अपने स्वयं के स्टोर में लिख रहा था। यह व्यस्त लग रहा था। यह एक ऐसे मंच पर बैकअप कलाकार की तरह था जहाँ संवाद कोई दूसरा अभिनेता बोल रहा था।

जो सिस्टम शोर मचाते हुए विफल होता है, उसे ठीक करना आसान है। आप त्रुटि देखते हैं और कार्रवाई करते हैं।

जो सिस्टम चुपचाप विफल होता है, वह खतरनाक है। यह मददगार उत्तर देता है। यह सफलता जैसा दिखता है। आप आउटपुट देखकर यह नहीं बता सकते कि आपका सिस्टम काम कर रहा है या नहीं। आउटपुट वही रहता है।

सच्चाई जानने के लिए आपको एक 'फोर्सिंग फंक्शन' की आवश्यकता है। आपको दूसरे सिस्टम को बंद करना होगा।

यह टेस्ट किसी भी एजेंट मेमोरी सेटअप के लिए काम करता है। इसमें केवल एक मिनट लगता है।

इन चरणों का पालन करें:

• अपने रनटाइम की नेटिव मेमोरी को बंद करें। • Claude Code में, इस कमांड का उपयोग करें: CLAUDE_CODE_DISABLE_AUTO_MEMORY=1 • अपने एजेंट का सामान्य रूप से उपयोग करें। • इसे कोई विशिष्ट तथ्य याद रखने के लिए कहें। • एक नया सेशन शुरू करें और उस तथ्य के बारे में पूछें।

देखें कि आपका सिस्टम अकेले क्या करता है।

यदि मेमोरी काम करती है, तो आपका सिस्टम मजबूत है।

यदि मेमोरी खाली हो जाती है, तो नेटिव स्टोर ही आपका काम संभाल रहा था। आपके द्वारा दिया गया हर डेमो एक परछाई था, आपका सिस्टम नहीं।

जब मैंने यह टेस्ट किया, तो मेरा सिस्टम शांत हो गया। छह महीने की सफलता वास्तव में छह महीने तक किसी और चीज़ द्वारा मेरी गलतियों को छिपाए रखने का परिणाम थी।

यदि आप ऐसे रनटाइम में मेमोरी जोड़ते हैं जिसमें पहले से ही मेमोरी है, तो आप इस जोखिम का सामना करते हैं। जैसे-जैसे मॉडल स्मार्ट होते जा रहे हैं, वे इन कमियों को बेहतर तरीके से छिपा रहे हैं। एक शानदार डेमो यह साबित नहीं करता कि आपका सिस्टम काम कर रहा है। यह केवल यह साबित कर सकता है कि मॉडल आपकी विफलता को छिपाने के लिए पर्याप्त सक्षम है।

अच्छे उत्तरों पर भरोसा न करें। 'ऑफ-टेस्ट' चलाएं। दूसरी चीज़ को बंद करें और पता लगाएं कि वास्तव में कौन बात कर रहा है।

इसे सीखने में मुझे छह महीने लगे। आपको केवल एक मिनट लगेगा।

स्रोत: https://dev.to/hendrixxcnc/your-agents-memory-looks-like-it-works-here-is-a-one-minute-test-that-tells-you-if-it-actually-4j2c

वैकल्पिक लर्निंग कम्युनिटी: https://t.me/GyaanSetuAi