AI এজেন্ট রোলব্যাক প্ল্যান: ব্যবহারকারীরা বিশ্বাস হারানোর আগেই ভুল কাজগুলো সংশোধন করুন

একটি নির্ভরযোগ্য AI এজেন্টকে নিখুঁত হওয়ার প্রয়োজন নেই। এর প্রয়োজন হলো কীভাবে থামতে হয়, নিজের ভুল ব্যাখ্যা করতে হয় এবং পরিস্থিতি থেকে পুনরুদ্ধার করতে হয় তা জানা।

আপনার এজেন্ট যদি ভুল CRM ফিল্ড আপডেট করে বা ডুপ্লিকেট পেমেন্ট পাঠিয়ে দেয়, তবে কেবল পুনরায় চেষ্টা (retry) করলে ক্ষতি কাটিয়ে ওঠা সম্ভব নয়। একটি প্রকৃত ঘটনার সম্মুখীন হওয়ার আগেই আপনার একটি রোলব্যাক প্ল্যান থাকা প্রয়োজন।

এজেন্টরা যখন চ্যাট থেকে প্রকৃত কাজের দিকে অগ্রসর হচ্ছে, তখন তারা এখন স্টেট (state) পরিবর্তন বা মিউটেশন করছে। এটি রোলব্যাককে কেবল একটি ব্যাকএন্ড টাস্ক নয়, বরং একটি প্রোডাক্ট ফিচার হিসেবে প্রতিষ্ঠিত করেছে।

সাধারণ ব্যর্থতার ধরনসমূহ:

  • এজেন্ট ভুল রেকর্ড ID ব্যবহার করে।
  • একটি রিট্রাই (retry) একই কাজ দুবার সম্পন্ন করে।
  • মডেল পরিবর্তন করার ফলে টুলের কার্যপদ্ধতি বদলে যায়।
  • একটি ওয়ার্কফ্লো পুরনো মেমরি নিয়ে পুনরায় শুরু হয়।
  • একটি আংশিক সিকোয়েন্স ডেটাকে অসংলগ্ন (inconsistent) করে ফেলে।

কীভাবে একটি রিকভারি লেয়ার তৈরি করবেন:

  1. একটি অ্যাকশন লেজার (Action Ledger) ব্যবহার করুন শুধুমাত্র লগের ওপর নির্ভর করবেন না। একটি লেজার তৈরি করুন যা প্রতিটি স্টেট পরিবর্তন রেকর্ড করে। প্রতিটি টুল কলের ক্ষেত্রে এক্সিকিউশনের আগে এবং পরে একটি এন্ট্রি থাকতে হবে। রিকভারির জন্য এটিই হবে আপনার তথ্যের একমাত্র নির্ভরযোগ্য উৎস (source of truth)।

  2. আপনার অ্যাকশনগুলোকে শ্রেণীবদ্ধ করুন সব অ্যাকশন একরকম নয়।

  • Read-only: রোলব্যাকের প্রয়োজন নেই।
  • Internal updates: একটি স্ন্যাপশট থেকে পূর্ববর্তী মান পুনরুদ্ধার করুন।
  • External reversible: ইভেন্টটি মুছে ফেলুন বা স্ট্যাটাস আপডেট করুন।
  • External irreversible: প্রকৃত 'undo'-এর পরিবর্তে কম্পেনসেশন (compensation) ব্যবহার করুন। ইমেল বা পেমেন্টের ক্ষেত্রে আপনি সেগুলো "un-send" করতে পারবেন না। আপনাকে একটি সংশোধন বার্তা বা রিফান্ড পাঠাতে হবে।
  1. আইডেমপোটেন্সি (Idempotency) নিশ্চিত করুন মডেল আইডেমপোটেন্সি নিশ্চিত করে না। আপনার টুল রানটাইমকে এটি নিশ্চিত করতে হবে। আইডেমপোটেন্সি কী (idempotency keys) ব্যবহার করুন যাতে এজেন্ট কোনো টাস্ক পুনরায় চেষ্টা করলে তা কোনো ডুপ্লিকেট সাইড ইফেক্ট তৈরি না করে।

  2. সাগা প্যাটার্ন (Saga Pattern) ব্যবহার করুন দীর্ঘ ওয়ার্কফ্লোর জন্য, প্রতিটি অগ্রবর্তী অ্যাকশনের বিপরীতে একটি কম্পেনসেটিং অ্যাকশন প্রয়োজন।

  • একটি টাস্ক তৈরি করলেন? এর কম্পেনসেশন হলো সেটি মুছে ফেলা বা বাতিল করা।
  • একটি ফিল্ড আপডেট করলেন? এর কম্পেনসেশন হলো পুরনো মান পুনরুদ্ধার করা।
  • একটি ইমেল পাঠালেন? এর কম্পেনসেশন হলো একটি সংশোধন বার্তা পাঠানো।
  1. চেকপয়েন্ট (Checkpoints) ইমপ্লিমেন্ট করুন ক্র্যাশ করার পর মডেলকে "আমরা কোথায় ছিলাম তা খুঁজে বের করতে" বলা বন্ধ করুন। বর্তমান স্টেট, সম্পন্ন হওয়া অ্যাকশন এবং পেন্ডিং টাস্কগুলো সংরক্ষণ করতে চেকপয়েন্ট ব্যবহার করুন। কাজ পুনরায় শুরু করার জন্য সিস্টেমকে সেই চেকপয়েন্ট লোড করতে হবে।

  2. একটি রিকভারি কিউ (Recovery Queue) তৈরি করুন যখন কোনো ভেরিফিকেশন স্টেপ ব্যর্থ হয়, তখন টাস্কটিকে একটি রিকভারি কিউতে সরিয়ে নিন। এটি আপনাকে টাস্কটি পুনরায় শুরু করতে, কম্পেনসেট করতে বা বন্ধ করতে সাহায্য করবে। উচ্চ-ঝুঁকিপূর্ণ ভুলের ক্ষেত্রে সর্বদা মানুষের অনুমোদনের জন্য অপেক্ষা করুন।

দৃশ্যমান রিকভারির মাধ্যমেই বিশ্বাস তৈরি হয়। যখন কোনো এজেন্ট ভুল করে, তখন অস্পষ্ট ভাষা ব্যবহার করবেন না। ব্যবহারকারীকে স্পষ্টভাবে জানান ঠিক কী পরিবর্তন হয়েছে, কেন এটি ঘটেছে এবং আপনি কীভাবে এটি ঠিক করেছেন।

প্রথম কোনো ঘটনার সম্মুখীন হওয়ার আগেই আপনার রোলব্যাক প্ল্যান তৈরি করে রাখুন।

Source: https://dev.to/jackm-singularity/ai-agent-rollback-plan-undo-bad-actions-before-users-lose-trust-4927

Optional learning community: https://t.me/GyaanSetuAi