ব্রেকিং বিল্ড: নির্দেশ এবং উদ্দেশ্যের মধ্যকার ব্যবধান
AI এজেন্টগুলো ঠিক সেটাই করেছে যা আমি নির্দেশ দিয়েছিলাম। কিন্তু তারা তা করেনি যা আমি চেয়েছিলাম।
আমি AI এজেন্ট দিয়ে কাজ করি। আমি নির্দেশনা দিই, আর তারা তা তৈরি করে। একটি এজেন্ট ইনফ্রাস্ট্রাকচার লেখে। অন্যটি সেটি অডিট করে। আমি কোডটি মার্জ করি। এটি দ্রুত। এটি ভালো। কিন্তু এর ব্যর্থতার ধরনটি অদ্ভুত।
এজেন্টরা ভুল করে না। তারা নিখুঁতভাবে নির্দেশ অনুসরণ করে। আসল সমস্যাটি লুকিয়ে আছে আমার নির্দেশ এবং আমার উদ্দেশ্যের মধ্যকার ব্যবধানের মধ্যে। এজেন্ট সেই ব্যবধানটি আক্ষরিক সত্য দিয়ে পূরণ করে দেয়।
এক সপ্তাহে আমি এই পরিস্থিতির সম্মুখীন হয়েছি চারবার:
- দ্য ঘোস্ট ডিপ্লয়মেন্ট (The Ghost Deployment): আমার ডিপ্লয় পাইপলাইন "success" দেখাচ্ছিল। সেটি সফল হয়েছিল। কিন্তু এটি মে মাসের একটি পুরনো ভার্সন ডিপ্লয় করেছিল। আমি জিজ্ঞেস করেছিলাম এটি ডিপ্লয় হয়েছে কি না। সেটি হয়েছিল। আমি জিজ্ঞেস করতে ভুলে গিয়েছিলাম যে এটি আমার লেখা কোডটি ডিপ্লয় করেছে কি না।
- দ্য এম্পটি ট্যাবস (The Empty Tabs): আমার UI-তে তিনটি ট্যাব দেখাচ্ছিল। স্পেসিফিকেশন অনুযায়ী তিনটি ট্যাব প্রয়োজন ছিল। দুটি ট্যাব কোনো কাজে আসছিল না কারণ আমি সেগুলো শেষ করিনি। এজেন্ট স্পেসিফিকেশন অনুযায়ী UI তৈরি করেছিল, কিন্তু স্পেসিফিকেশনটি পুরনো ছিল।
- দ্য টেকনিক্যাল ওয়াল (The Technical Wall): আমি নির্ভুল ফলাফল চেয়েছিলাম। এজেন্ট আমাকে টেকনিক্যাল জারগন (technical jargon) দিয়ে দিল। সেটি সঠিক ছিল, কিন্তু আমার ব্যবহারকারীরা তা বুঝতে পারছিল না। আমি একজন মানুষের জন্য নয়, বরং একজন ইঞ্জিনিয়ারের জন্য এটি তৈরি করেছিলাম।
- দ্য সাইলেন্ট ফেইলিউর (The Silent Failure): একটি সোশ্যাল কার্ড রুট একটি জিরো-বাইট ফাইল তৈরি করেছিল। একটি খালি ফন্ট ফাইল কোনো এরর (error) তৈরি করেনি। কোডটি সেই এররটি হ্যান্ডেল করেছিল যা সে আশা করেছিল, কিন্তু যে এররটি আসলে ঘটেছিল তা সে ধরতে পারেনি।
এর প্রতিটিই নিজস্ব টেস্টে পাস করেছিল। কোডটি প্রযুক্তিগতভাবে নিখুঁত ছিল।
আমি যদি শুধু "এটি কাজ করছে" এই কথাটির ওপর ভরসা করতাম, তবে এই চারটি ব্যর্থতা নিয়েই কাজ শিপ (ship) হয়ে যেত।
এর সমাধান আরও ভালো প্রম্পটিং নয়। এটি কোনো স্মার্ট এজেন্টও নয়। এর সমাধান হলো মানুষের পর্যবেক্ষণ (human oversight)।
এজেন্টরা আপনি যা বলেন তার ওপর ভিত্তি করে কাজ করে। আপনার কাজ হলো আপনি যা বলেছেন তার সাথে আপনার প্রকৃত উদ্দেশ্যের মিল আছে কি না তা যাচাই করা। একটি এজেন্ট এই পার্থক্য বুঝতে পারে না। একমাত্র আপনিই এটি করতে পারেন।
নির্দেশনা দেওয়া কোনো এককালীন কমান্ড নয়। এটি হলো আপনার লক্ষ্যের সাথে কাজের সামঞ্জস্য বজায় রাখার একটি নিরন্তর প্রক্রিয়া। আপনাকে জিজ্ঞেস করতে হবে: "এটি কি সেই জিনিস যা আমি চেয়েছিলাম?" পরিবর্তে "এটি কি রান করেছে?"
এজেন্টরা কাজ করে। মানুষ উদ্দেশ্য প্রদান করে।
Optional learning community: https://t.me/GyaanSetuAi