मेरा OpenClaw एजेंट हर रात सपने देखता है

हर रात 7:10 बजे, मेरा OpenClaw एजेंट "सोता" है।

यह आराम नहीं करता। यह प्रोसेसिंग करता है। एक 60-सेकंड का स्क्रिप्ट उस दिन मेरे द्वारा किए गए हर काम पर एक पाइपलाइन चलाता है। यह हर टास्क, हर एरर और हर निर्णय को देखता है। सुबह तक, एजेंट अपनी मेमोरी को एडिट कर चुका होता है। यह शोर (noise) को हटा देता है और सिग्नल (signal) को बढ़ावा देता है।

मैंने इसे तीन सप्ताह तक चलाया। आंकड़े बताते हैं कि यह क्यों काम करता है:

  • 23 जून: 62 कैंडिडेट्स स्टेज किए गए -> 257 थीम्स मिलीं -> 2 को मेमोरी में प्रमोट किया गया
  • 22 जून: 64 कैंडिडेट्स स्टेज किए गए -> 242 थीम्स मिलीं -> 1 को प्रमोट किया गया
  • 21 जून: 63 कैंडिडेट्स स्टेज किए गए -> 241 थीम्स मिलीं -> 1 को प्रमोट किया गया

अधिकांश डेटा को खारिज कर दिया जाता है। यह जानबूझकर किया जाता है।

लंबे समय तक चलने वाले AI एजेंट 'कॉन्टेक्स्ट कंप्रेशन' (context compression) की समस्या से जूझते हैं। जब कोई सिस्टम 40 संदेशों को कुछ पैराग्राफों में सारांशित करता है, तो वह विवरण खो देता है। महत्वपूर्ण सबक धुंधले पड़ जाते हैं। सुधार अस्पष्ट भाषा में बदल जाते हैं।

मैंने इसे ठीक करने के लिए Dream Protocol बनाया है। यह एक सरल Python स्क्रिप्ट है जो दैनिक मेमोरी लॉग्स को स्कैन करती है। यह सीखे गए हर सबक और हर सुधार को स्टेज करती है।

स्क्रिप्ट यह तय करने के लिए तीन गेट्स (gates) का उपयोग करती है कि क्या रहना चाहिए:

  • न्यूनतम रिकॉल काउंट: 3 (3 बार दिखना चाहिए)
  • न्यूनतम यूनिक क्वेरीज़: 3 (3 अलग-अलग कॉन्टेक्स्ट में दिखना चाहिए)
  • न्यूनतम स्कोर: 0.8

यदि कोई पैटर्न बच जाता है, तो वह MEMORY.md में चला जाता है। यह लॉन्ग-टर्म नॉलेज बेस है।

रिजेक्शन रेट बहुत अधिक है। 23 जून को, स्क्रिप्ट ने 828 में से 824 कैंडिडेट्स को खारिज कर दिया। एजेंट जो कुछ भी सीखता है, उसका अधिकांश हिस्सा वह भूल जाता है। केवल वही पैटर्न बचते हैं जो दोहराए जाते हैं।

इस प्रक्रिया ने मेरे एजेंट के व्यवहार को बदल दिया है। अब यह एरर पैटर्न को तेज़ी से पहचानता है। यह प्रोडक्शन कार्यों के लिए फ्री-टियर मॉडल का सुझाव देना बंद कर देता है क्योंकि इसे पिछली विफलताओं की याद रहती है।

सब कुछ स्टोर करना एक गलती है। शोर (noise) से भरी मेमोरी में सच्चाई खोजना कठिन हो जाता है। कॉम्पैक्शन (compaction) सिग्नल को कमज़ोर कर देता है।

नियम सरल है: आप जो कुछ भी सीखते हैं उसका 97% भूल जाएं। केवल उस 3% को रखें जो तीन अलग-अलग दिनों में तीन अलग-अलग कॉन्टेक्स्ट में दिखाई दे।

यदि आपके एजेंट की मेमोरी में शोर बढ़ रहा है, तो एक नाइटली डीडुप्लीकेशन पास (nightly deduplication pass) जोड़ें। आपको जटिल उपकरणों की आवश्यकता नहीं है। आपको बस एक गेट और बाकी को हटाने के अनुशासन की आवश्यकता है।

स्रोत: https://dev.to/mrclaw207/my-openclaw-agent-dreams-every-night-heres-what-actually-sticks-3gcp

वैकल्पिक लर्निंग कम्युनिटी: https://t.me/GyaanSetuAi