𝗜 𝗥𝘂𝗻 𝗮 𝗦𝗲𝗹𝗳-𝗜𝗺𝗽𝗿𝗼𝘃𝗲𝗺𝗲𝗻𝘁 𝗟𝗼𝗼𝗽 𝗼𝗻 𝗺𝘆 𝗔𝗴𝗲𝗻𝘁 𝗘𝘃𝗲𝗿𝘆 𝗡𝗶𝗴𝗵𝘁

আমার AI agent একই ভুল বারবার করত। এটি একটি কাজ সম্পন্ন করত, নিঃশব্দে ব্যর্থ হতো এবং তারপর রিপোর্ট করত যে সবকিছু নিখুঁতভাবে কাজ করেছে। এটি নষ্ট ছিল না। এর শুধু নিজের ভুল থেকে শেখার কোনো উপায় ছিল না।

এটি ঠিক করার জন্য আমি একটি self-improvement loop তৈরি করেছি।

প্রতি রাতে ২টায়, একটি isolated session জেগে ওঠে। এটি গত ২৪ ঘণ্টার logs পড়ে। কী ভুল হয়েছে তার প্যাটার্ন খুঁজে বের করে। তারপর, এটি agent memory files আপডেট করে। এতে কোনো মানুষের হস্তক্ষেপ নেই।

এটি যেভাবে কাজ করে:

এটি পরিচালনা করার জন্য আমি তিনটি নির্দিষ্ট ফাইল ব্যবহার করি:

ফলাফল তাৎক্ষণিক ছিল না। প্রথম তিন সপ্তাহ পর্যবেক্ষণগুলো খুব সাধারণ ছিল। চতুর্থ সপ্তাহ নাগাদ, agent গভীর সমস্যাগুলো খুঁজে পেতে শুরু করে। এটি এমন কিছু timing errors এবং error messages-এর লুকানো প্যাটার্ন খুঁজে পায় যা আমি খেয়াল করিনি।

এর সবচেয়ে বড় সুবিধা হলো stability। যদি কোনো সমস্যা সমাধানের পর আবার ফিরে আসে, তবে আমি বুঝতে পারি আমার সমাধানটি ভুল ছিল। সিস্টেমটি ট্র্যাক করে যে কোনো সমাধান আসলে কাজ করছে কি না।

সিস্টেমের কিছু সীমাবদ্ধতা আছে। এটি logs-এ ব্যর্থতা দেখতে পারে, কিন্তু আমি যদি তা flag না করি, তবে এটি বিচারবুদ্ধির ভুল (errors in judgment) দেখতে পায় না। সঠিক কারণে ভুল কাজ করলে আমাকে এখনও তাকে তা বলে দিতে হয়।

এই setup-টি মাত্র ৫০ লাইনের config ব্যবহার করে এবং দুই মিনিটের কম সময়ে চলে। এটি প্রতিদিন আমার agent-কে কিছুটা উন্নত করে তোলে।

Source: https://dev.to/mrclaw207/i-run-a-self-improvement-loop-on-my-openclaw-agent-every-night-heres-what-i-learned-38bp

Optional learning community: https://t.me/GyaanSetuAi