আমার বায়াস ডিটেক্টর "No Info"-তে Cherry-Picking খুঁজে পেয়েছে
আমি Biassemble নামে একটি প্রজেক্ট তৈরি করেছি।
এর লক্ষ্য খুব সহজ। আপনি এটিকে একটি গল্প দেবেন। এটি প্রশ্ন করবে। আপনি কীভাবে যুক্তি দিচ্ছেন তার মধ্যে থাকা cognitive biases শনাক্ত করবে।
আমি আন্না নামের এক মহিলার গল্প দিয়ে এটি পরীক্ষা করেছি। তার গল্পে কেবল তথ্য ছিল। তিনি কফি পান করেছিলেন। তিনি বাসে চড়েছিলেন। তিনি হেঁটে তার অফিসে গিয়েছিলেন। টেক্সটটিতে কোনো মতামত বা আবেগ ছিল না।
আমার প্রথম প্রম্পটে একটি নিয়ম ছিল: একটি তালিকা থেকে অন্তত একটি বায়াস শনাক্ত করো।
এই নিয়মটি সিস্টেমকে কিছু না কিছু খুঁজে বের করতে বাধ্য করেছিল। এমনকি যখন কিছুই ছিল না, তখনও সিস্টেমটি একটি বায়াস উদ্ভাবন করার চেষ্টা করেছিল।
আমি প্রম্পটটি আপডেট করে version 1.0.0 করেছি। আমি প্রমাণের জন্য একটি প্রয়োজনীয়তা যোগ করেছি। একটি বায়াস আছে তা প্রমাণ করার জন্য সিস্টেমকে গল্পের নির্দিষ্ট অংশ উদ্ধৃত করতে হতো।
আমি ভেবেছিলাম এতে সমস্যাটি সমাধান হয়ে যাবে। কিন্তু তা হয়নি।
যখন আমি ফলো-আপ প্রশ্নগুলোর উত্তরে "no info" দিয়েছিলাম, সিস্টেম আমাকে Cherry-Picking-এর জন্য চিহ্নিত করেছিল। এটি যুক্তি দিয়েছিল যে, আমার অনুমান করতে অস্বীকার করা ছিল তথ্য বাদ দেওয়ার একটি সুপরিকল্পিত সিদ্ধান্ত।
সিস্টেমটি প্রযুক্তিগতভাবে সঠিক ছিল। আমি সত্যিই চারবার "no info" বলেছিলাম। এটি আমার হুবহু শব্দগুলো উদ্ধৃত করেছিল। কিন্তু সিদ্ধান্তটি ভুল ছিল। এটি তথ্যের অভাবকে একটি reasoning error হিসেবে গণ্য করেছিল।
Grounding উদ্ধৃতিগুলোকে সত্যনিষ্ঠ করেছিল। কিন্তু এটি সিদ্ধান্তগুলোকে সঠিক করেনি।
আমি version 1.1.0 রিলিজ করেছি। আমি তিনটি নতুন চেক যোগ করেছি:
- শুরুতে একটি sufficiency check।
- একটি evidence-exclusion rule।
- একটি confidence threshold।
ফলাফল বদলে গেল। একই "no info" উত্তরের ক্ষেত্রেও version 1.1.0 কোনো বায়াস রিপোর্ট করেনি। এটি বুঝতে পেরেছিল যে আমার উত্তরগুলো interpretive হওয়ার পরিবর্তে descriptive ছিল।
এই দুটি ভার্সনের মধ্যে পার্থক্য প্রমাণের নয়। পার্থক্য হলো সিস্টেমটি "I don't know"-কে কীভাবে গ্রহণ করে।
একটি ভার্সন "I don't know"-কে বায়াসের লক্ষণ হিসেবে দেখে। অন্যটি এটিকে একটি বৈধ উত্তর হিসেবে দেখে। মডেলটিকে এটি কীভাবে হ্যান্ডেল করতে হবে তা আপনাকে বলে দিতে হবে। এটি নিজে থেকে সিদ্ধান্ত নিতে পারবে না।
আমি এখন এটি পরীক্ষা করার জন্য মেট্রিক্স তৈরি করছি। আমার জানা দরকার যে সিস্টেমটি কি সত্যিই উন্নত হয়েছে নাকি এটি কেবল এই নির্দিষ্ট গল্পটিকে উপেক্ষা করতে শিখেছে।
আমি ভেবেছিলাম আমি একটি বায়াস ডিটেক্টর তৈরি করছি। পরিবর্তে, আমি শিখলাম কেন reasoning systems গুলো "I don't know"-এর ক্ষেত্রে হিমশিম খায়।
Source: https://dev.to/lemind/my-bias-detector-found-cherry-picking-in-the-answer-no-info-9hf
Optional learning community: https://t.me/GyaanSetuAi