𝗬𝗼𝘂𝗿 𝗔𝗜 𝗔𝗴𝗲𝗻𝘁 𝗜𝘀𝗻'𝘁 𝗕𝗿𝗼𝗸𝗲𝗻. 𝗬𝗼𝘂𝗿 𝗖𝗼𝗺𝗽𝗮𝗻𝘆'𝘀 𝗧𝗿𝘂𝘁𝗵 𝗜𝘀.

একটি AI এজেন্টের একটি মাত্র কাজ ছিল। তাকে একটি অনুমোদিত ভেন্ডর ইনভয়েস পরিশোধ করতে হতো। ফাইন্যান্স টিম এই কাজটি ম্যানুয়ালি করা বন্ধ করতে চেয়েছিল।

মঙ্গলবার, এজেন্টটি ৪৮,০০০ Ksh-এর একটি ইনভয়েস গ্রহণ করে। ERP সিস্টেম এটিকে 'অনুমোদিত' (approved) এবং 'অপরিশোধিত' (unpaid) হিসেবে চিহ্নিত করেছিল। এজেন্টটি নিয়মগুলো পরীক্ষা করে দেখল। সবকিছু ঠিক ছিল। এরপর সে ইনভয়েসটি পরিশোধ করে দিল।

সমস্যাটি কী? ইনভয়েসটি গত বৃহস্পতিবার একজন মানুষ ইতিমধ্যেই পরিশোধ করে ফেলেছিলেন।

কোনো একটি সিস্টেমই ভুল ছিল না, কিন্তু তারা সবাই একে অপরের সাথে দ্বিমত পোষণ করছিল:

• ERP বলছিল এটি অপরিশোধিত কারণ ব্যাংক সিঙ্ক (bank sync) ব্যর্থ হয়েছিল। • ব্যাংক ফিড বলছিল এটি পরিশোধিত। • একটি Slack থ্রেডে বলা ছিল এই ভেন্ডরকে সমস্ত পেমেন্ট স্থগিত রাখতে। • ভেন্ডরের কাছ থেকে আসা একটি ইমেল নিশ্চিত করেছিল যে তারা টাকা পেয়েছেন।

প্রতিটি সিস্টেম ধাঁধার একটি অংশ ধারণ করছিল। কিন্তু কোনো সিস্টেমই একমাত্র গুরুত্বপূর্ণ প্রশ্নের উত্তর দিতে পারছিল না: এই নির্দিষ্ট ইনভয়েসটি কি পরিশোধ করা হয়েছে?

একজন মানব ক্লার্ক এটি ধরতে পারতেন। তারা বেশি বুদ্ধিমান বলে নয়, বরং তারা অসঙ্গতি (friction) অনুভব করতে পারেন বলে। একজন মানুষ কাজটি মনে রাখতে পারেন বা Slack মেসেজটি লক্ষ্য করতে পারেন। মানুষ বিশৃঙ্খল সিস্টেমগুলোর মধ্যে আঠা হিসেবে কাজ করে। আমরা বিচারবুদ্ধি (judgment) প্রদান করি।

AI এজেন্টদের কোনো সহজাত প্রবৃত্তি (instinct) নেই। তারা মেশিনের গতিতে ডেটা পড়ে। তারা "Approved" এবং "Unpaid" দেখে এবং কাজ করে ফেলে। কোনো কিছু ভুল হচ্ছে বলে তারা অনুভব করতে পারে না।

এজেন্টটি ব্যর্থ হয়নি। এটি ঠিক যেভাবে ডিজাইন করা হয়েছিল সেভাবেই কাজ করেছে। এই ব্যর্থতাকে আমি বলি 'এপিস্টেমিক কোলাপস' (epistemic collapse)।

বেশিরভাগ কোম্পানি উন্নত প্রম্পট বা উন্নত মডেল দিয়ে এজেন্টদের ঠিক করার চেষ্টা করে। এটি ভুল পদক্ষেপ। আপনার ডেটাতে যে তথ্য নেই, সেটি প্রম্পট দিয়ে বের করে আনা সম্ভব নয়।

আসল সমস্যা হলো এপিস্টেমিক ইনফ্রাস্ট্রাকচারের (epistemic infrastructure) অভাব।

ডেটা হলো যা আপনার সিস্টেমগুলো সংরক্ষণ করে। সত্য হলো যা আসলে ঘটছে। বেশিরভাগ কোম্পানির প্রচুর ডেটা আছে কিন্তু সত্যতা (truth) শূন্য।

বর্তমান সিস্টেমগুলো তিনটি ভিন্ন বিষয়কে একটি ফিল্ডের মধ্যে মিলিয়ে ফেলে:

  • পর্যবেক্ষণ (Observation): একটি সিস্টেম যা ঘটেছে বলে জানায়।
  • সত্য (Truth): যা আসলে সত্য।
  • ইতিহাস (History): যা আগে সত্য ছিল।

যখন একটি ডেটাবেস বলে "Status: Unpaid," তখন এটি ইতিহাস এবং সন্দেহ উভয়কেই মুছে ফেলে। এটি একটিমাত্র পর্যবেক্ষণকে পরম সত্য হিসেবে উপস্থাপন করে।

AI এজেন্টগুলো এই পুরনো সমস্যার জন্য একটি স্ট্রেস টেস্ট (stress test)। তারা সেই মানুষগুলোকে সরিয়ে দিচ্ছে যারা প্রতিদিন নীরবে এই বৈপরীত্যগুলো সমাধান করে আসছিলেন। এই ব্যবধানগুলো পূরণ করার জন্য মানুষ না থাকলে, আপনার ডেটার ফাটলগুলো ব্যয়বহুল ভুলের কারণ হয়ে দাঁড়াবে।

আরও উন্নত এজেন্ট তৈরির চেষ্টা বন্ধ করুন। তাদের নিচের স্তরটি (layer) তৈরি করা শুরু করুন। আপনার এমন একটি সিস্টেম প্রয়োজন যা পর্যবেক্ষণ ট্র্যাক করে, দ্বিমতগুলো শনাক্ত করে এবং পুরনো বা অপ্রাসঙ্গিক (stale) ডেটা চিহ্নিত করে।

যতক্ষণ না আপনি সত্যের একটি স্তর তৈরি করছেন, আপনার এজেন্টরা নিখুঁতভাবে ভুল কাজ করতে থাকবে।

উৎস: https://dev.to/code_with_mwai/your-ai-agent-isnt-broken-your-companys-truth-is-2cl8

ঐচ্ছিক লার্নিং কমিউনিটি: https://t.me/GyaanSetuAi