আমার বায়াস ডিটেক্টর "নো ইনফো"-তে চেরি পিকিং খুঁজে পেয়েছে

📅3 hours ago⏱2 min read

আমার বায়াস ডিটেক্টর "No Info"-তে Cherry-Picking খুঁজে পেয়েছে

আমি Biassemble নামে একটি প্রজেক্ট তৈরি করেছি।

এর লক্ষ্য খুব সহজ। আপনি এটিকে একটি গল্প দেবেন। এটি প্রশ্ন করবে। আপনি কীভাবে যুক্তি দিচ্ছেন তার মধ্যে থাকা cognitive biases শনাক্ত করবে।

আমি আন্না নামের এক মহিলার গল্প দিয়ে এটি পরীক্ষা করেছি। তার গল্পে কেবল তথ্য ছিল। তিনি কফি পান করেছিলেন। তিনি বাসে চড়েছিলেন। তিনি হেঁটে তার অফিসে গিয়েছিলেন। টেক্সটটিতে কোনো মতামত বা আবেগ ছিল না।

আমার প্রথম প্রম্পটে একটি নিয়ম ছিল: একটি তালিকা থেকে অন্তত একটি বায়াস শনাক্ত করো।

এই নিয়মটি সিস্টেমকে কিছু না কিছু খুঁজে বের করতে বাধ্য করেছিল। এমনকি যখন কিছুই ছিল না, তখনও সিস্টেমটি একটি বায়াস উদ্ভাবন করার চেষ্টা করেছিল।

আমি প্রম্পটটি আপডেট করে version 1.0.0 করেছি। আমি প্রমাণের জন্য একটি প্রয়োজনীয়তা যোগ করেছি। একটি বায়াস আছে তা প্রমাণ করার জন্য সিস্টেমকে গল্পের নির্দিষ্ট অংশ উদ্ধৃত করতে হতো।

আমি ভেবেছিলাম এতে সমস্যাটি সমাধান হয়ে যাবে। কিন্তু তা হয়নি।

যখন আমি ফলো-আপ প্রশ্নগুলোর উত্তরে "no info" দিয়েছিলাম, সিস্টেম আমাকে Cherry-Picking-এর জন্য চিহ্নিত করেছিল। এটি যুক্তি দিয়েছিল যে, আমার অনুমান করতে অস্বীকার করা ছিল তথ্য বাদ দেওয়ার একটি সুপরিকল্পিত সিদ্ধান্ত।

সিস্টেমটি প্রযুক্তিগতভাবে সঠিক ছিল। আমি সত্যিই চারবার "no info" বলেছিলাম। এটি আমার হুবহু শব্দগুলো উদ্ধৃত করেছিল। কিন্তু সিদ্ধান্তটি ভুল ছিল। এটি তথ্যের অভাবকে একটি reasoning error হিসেবে গণ্য করেছিল।

Grounding উদ্ধৃতিগুলোকে সত্যনিষ্ঠ করেছিল। কিন্তু এটি সিদ্ধান্তগুলোকে সঠিক করেনি।

আমি version 1.1.0 রিলিজ করেছি। আমি তিনটি নতুন চেক যোগ করেছি:

শুরুতে একটি sufficiency check।
একটি evidence-exclusion rule।
একটি confidence threshold।

ফলাফল বদলে গেল। একই "no info" উত্তরের ক্ষেত্রেও version 1.1.0 কোনো বায়াস রিপোর্ট করেনি। এটি বুঝতে পেরেছিল যে আমার উত্তরগুলো interpretive হওয়ার পরিবর্তে descriptive ছিল।

এই দুটি ভার্সনের মধ্যে পার্থক্য প্রমাণের নয়। পার্থক্য হলো সিস্টেমটি "I don't know"-কে কীভাবে গ্রহণ করে।

একটি ভার্সন "I don't know"-কে বায়াসের লক্ষণ হিসেবে দেখে। অন্যটি এটিকে একটি বৈধ উত্তর হিসেবে দেখে। মডেলটিকে এটি কীভাবে হ্যান্ডেল করতে হবে তা আপনাকে বলে দিতে হবে। এটি নিজে থেকে সিদ্ধান্ত নিতে পারবে না।

আমি এখন এটি পরীক্ষা করার জন্য মেট্রিক্স তৈরি করছি। আমার জানা দরকার যে সিস্টেমটি কি সত্যিই উন্নত হয়েছে নাকি এটি কেবল এই নির্দিষ্ট গল্পটিকে উপেক্ষা করতে শিখেছে।

আমি ভেবেছিলাম আমি একটি বায়াস ডিটেক্টর তৈরি করছি। পরিবর্তে, আমি শিখলাম কেন reasoning systems গুলো "I don't know"-এর ক্ষেত্রে হিমশিম খায়।

Source: https://dev.to/lemind/my-bias-detector-found-cherry-picking-in-the-answer-no-info-9hf

Optional learning community: https://t.me/GyaanSetuAi

আমার বায়াস ডিটেক্টর "নো ইনফো"-তে চেরি পিকিং খুঁজে পেয়েছে

Continue reading

স্ট্যাকিংয়ের ফাঁদ

যে কোড এআই লিখবে না

আপনার AI হ্যালুসিনেশন করছে না। এটি আসলে অনুমান করছে।

সার্চ ইঞ্জিন হিসেবে এআই ব্যবহার করা বন্ধ করুন

𝗧𝗵𝗲 𝗔𝗹𝗴𝗼𝗿𝗶𝘁𝗵𝗺𝗶𝗰 𝗖𝗼𝗻𝘀𝘁𝗿𝘂𝗰𝘁𝗶𝗼𝗻 𝗼𝗳 𝗘𝗽𝗶𝘀𝘁𝗲𝗺𝗶𝗰 𝗜𝗻𝗷𝘂𝘀𝘁𝗶𝗰𝗲