আমার OpenClaw এজেন্ট প্রতি রাতে স্বপ্ন দেখে
প্রতি রাতে ৭:১০ মিনিটে, আমার OpenClaw এজেন্ট "ঘুমায়"।
এটি বিশ্রাম নেয় না। এটি প্রসেস করে। একটি ৬০-সেকেন্ডের স্ক্রিপ্ট সেই দিন আমি যা যা করেছি তার ওপর একটি পাইপলাইন চালায়। এটি প্রতিটি কাজ, প্রতিটি ভুল এবং প্রতিটি সিদ্ধান্ত পর্যালোচনা করে। সকালের মধ্যে, এজেন্ট তার মেমরি এডিট করে ফেলে। এটি অপ্রয়োজনীয় তথ্য (noise) বাদ দেয় এবং গুরুত্বপূর্ণ তথ্যকে (signal) প্রাধান্য দেয়।
আমি এটি তিন সপ্তাহ ধরে চালিয়েছি। সংখ্যাগুলো দেখায় কেন এটি কার্যকর:
- ২৩ জুন: ৬২টি ক্যান্ডিডেট স্টেজ করা হয়েছে -> ২৫৭টি থিম পাওয়া গেছে -> ২টি মেমরিতে প্রমোট করা হয়েছে
- ২২ জুন: ৬৪টি ক্যান্ডিডেট স্টেজ করা হয়েছে -> ২৪২টি থিম পাওয়া গেছে -> ১টি প্রমোট করা হয়েছে
- ২১ জুন: ৬৩টি ক্যান্ডিডেট স্টেজ করা হয়েছে -> ২৪১টি থিম পাওয়া গেছে -> ১টি প্রমোট করা হয়েছে
বেশিরভাগ ডেটা রিজেক্ট হয়ে যায়। এটি উদ্দেশ্যমূলক।
দীর্ঘ সময় ধরে চলা AI এজেন্টরা context compression-এর সমস্যায় ভোগে। যখন একটি সিস্টেম ৪০টি মেসেজকে কয়েকটা প্যারাগ্রাফে সারসংক্ষেপ করে, তখন এটি বিস্তারিত তথ্য হারিয়ে ফেলে। গুরুত্বপূর্ণ শিক্ষাগুলো ফিকে হয়ে যায়। সংশোধনগুলো অস্পষ্ট ভাষায় পরিণত হয়।
এটি ঠিক করার জন্য আমি Dream Protocol তৈরি করেছি। এটি একটি সাধারণ Python স্ক্রিপ্ট যা প্রতিদিনের মেমরি লগ স্ক্যান করে। এটি প্রতিটি শেখা শিক্ষা এবং প্রতিটি সংশোধন স্টেজ করে।
কী থাকবে তা নির্ধারণ করতে স্ক্রিপ্টটি তিনটি গেট (gate) ব্যবহার করে:
- সর্বনিম্ন রিকল কাউন্ট: ৩ (অবশ্যই ৩ বার থাকতে হবে)
- সর্বনিম্ন ইউনিক কোয়েরি: ৩ (অবশ্যই ৩টি ভিন্ন প্রেক্ষাপটে থাকতে হবে)
- সর্বনিম্ন স্কোর: ০.৮
যদি কোনো প্যাটার্ন টিকে থাকে, তবে তা MEMORY.md-এ চলে যায়। এটি হলো দীর্ঘমেয়াদী নলেজ বেস।
রিজেকশন রেট অনেক বেশি। ২৩ জুন, স্ক্রিপ্টটি ৮২৮টি ক্যান্ডিডেটের মধ্যে ৮২৪টি রিজেক্ট করেছে। এজেন্ট যা শেখে তার বেশিরভাগই সে ভুলে যায়। শুধুমাত্র পুনরাবৃত্তিমূলক প্যাটার্নগুলোই টিকে থাকে।
এই প্রক্রিয়াটি আমার এজেন্টের আচরণ বদলে দিয়েছে। এটি এখন দ্রুত এরর প্যাটার্ন চিনতে পারে। এটি প্রোডাকশন টাস্কের জন্য ফ্রি-টিয়ার মডেল সাজেস্ট করা বন্ধ করে দিয়েছে কারণ এটি আগের ব্যর্থতাগুলো মনে রাখতে পারে।
সবকিছু জমা রাখা একটি ভুল। অপ্রয়োজনীয় তথ্যে (noise) ভরা মেমরি থেকে সত্য খুঁজে পাওয়া কঠিন হয়ে পড়ে। কম্প্যাকশন (compaction) গুরুত্বপূর্ণ তথ্যকে (signal) হালকা করে দেয়।
নিয়মটি সহজ: আপনি যা শিখছেন তার ৯৭% ভুলে যান। শুধুমাত্র সেই ৩% রাখুন যা তিনটি ভিন্ন দিনে তিনটি ভিন্ন প্রেক্ষাপটে দেখা যায়।
যদি আপনার এজেন্টের মেমরি অগোছালো বা noisy হয়ে ওঠে, তবে প্রতি রাতে একটি deduplication pass যোগ করুন। আপনার জটিল টুলের প্রয়োজন নেই। আপনার প্রয়োজন একটি গেট এবং বাকিগুলো মুছে ফেলার শৃঙ্খলা।
উৎস: https://dev.to/mrclaw207/my-openclaw-agent-dreams-every-night-heres-what-actually-sticks-3gcp
ঐচ্ছিক লার্নিং কমিউনিটি: https://t.me/GyaanSetuAi
