আমার বায়াস ডিটেক্টর "No Info"-তে Cherry-Picking খুঁজে পেয়েছে

আমি Biassemble নামে একটি প্রজেক্ট তৈরি করেছি।

এর লক্ষ্য খুব সহজ। আপনি এটিকে একটি গল্প দেবেন। এটি প্রশ্ন করবে। আপনি কীভাবে যুক্তি দিচ্ছেন তার মধ্যে থাকা cognitive biases শনাক্ত করবে।

আমি আন্না নামের এক মহিলার গল্প দিয়ে এটি পরীক্ষা করেছি। তার গল্পে কেবল তথ্য ছিল। তিনি কফি পান করেছিলেন। তিনি বাসে চড়েছিলেন। তিনি হেঁটে তার অফিসে গিয়েছিলেন। টেক্সটটিতে কোনো মতামত বা আবেগ ছিল না।

আমার প্রথম প্রম্পটে একটি নিয়ম ছিল: একটি তালিকা থেকে অন্তত একটি বায়াস শনাক্ত করো।

এই নিয়মটি সিস্টেমকে কিছু না কিছু খুঁজে বের করতে বাধ্য করেছিল। এমনকি যখন কিছুই ছিল না, তখনও সিস্টেমটি একটি বায়াস উদ্ভাবন করার চেষ্টা করেছিল।

আমি প্রম্পটটি আপডেট করে version 1.0.0 করেছি। আমি প্রমাণের জন্য একটি প্রয়োজনীয়তা যোগ করেছি। একটি বায়াস আছে তা প্রমাণ করার জন্য সিস্টেমকে গল্পের নির্দিষ্ট অংশ উদ্ধৃত করতে হতো।

আমি ভেবেছিলাম এতে সমস্যাটি সমাধান হয়ে যাবে। কিন্তু তা হয়নি।

যখন আমি ফলো-আপ প্রশ্নগুলোর উত্তরে "no info" দিয়েছিলাম, সিস্টেম আমাকে Cherry-Picking-এর জন্য চিহ্নিত করেছিল। এটি যুক্তি দিয়েছিল যে, আমার অনুমান করতে অস্বীকার করা ছিল তথ্য বাদ দেওয়ার একটি সুপরিকল্পিত সিদ্ধান্ত।

সিস্টেমটি প্রযুক্তিগতভাবে সঠিক ছিল। আমি সত্যিই চারবার "no info" বলেছিলাম। এটি আমার হুবহু শব্দগুলো উদ্ধৃত করেছিল। কিন্তু সিদ্ধান্তটি ভুল ছিল। এটি তথ্যের অভাবকে একটি reasoning error হিসেবে গণ্য করেছিল।

Grounding উদ্ধৃতিগুলোকে সত্যনিষ্ঠ করেছিল। কিন্তু এটি সিদ্ধান্তগুলোকে সঠিক করেনি।

আমি version 1.1.0 রিলিজ করেছি। আমি তিনটি নতুন চেক যোগ করেছি:

ফলাফল বদলে গেল। একই "no info" উত্তরের ক্ষেত্রেও version 1.1.0 কোনো বায়াস রিপোর্ট করেনি। এটি বুঝতে পেরেছিল যে আমার উত্তরগুলো interpretive হওয়ার পরিবর্তে descriptive ছিল।

এই দুটি ভার্সনের মধ্যে পার্থক্য প্রমাণের নয়। পার্থক্য হলো সিস্টেমটি "I don't know"-কে কীভাবে গ্রহণ করে।

একটি ভার্সন "I don't know"-কে বায়াসের লক্ষণ হিসেবে দেখে। অন্যটি এটিকে একটি বৈধ উত্তর হিসেবে দেখে। মডেলটিকে এটি কীভাবে হ্যান্ডেল করতে হবে তা আপনাকে বলে দিতে হবে। এটি নিজে থেকে সিদ্ধান্ত নিতে পারবে না।

আমি এখন এটি পরীক্ষা করার জন্য মেট্রিক্স তৈরি করছি। আমার জানা দরকার যে সিস্টেমটি কি সত্যিই উন্নত হয়েছে নাকি এটি কেবল এই নির্দিষ্ট গল্পটিকে উপেক্ষা করতে শিখেছে।

আমি ভেবেছিলাম আমি একটি বায়াস ডিটেক্টর তৈরি করছি। পরিবর্তে, আমি শিখলাম কেন reasoning systems গুলো "I don't know"-এর ক্ষেত্রে হিমশিম খায়।

Source: https://dev.to/lemind/my-bias-detector-found-cherry-picking-in-the-answer-no-info-9hf

Optional learning community: https://t.me/GyaanSetuAi