"നോ ഇൻഫോ"-യിലെ ചെറി പിക്കിംഗ് എന്റെ ബയാസ് ഡിറ്റക്ടർ കണ്ടെത്തി

📅3 hours ago⏱2 min read

"No Info" എന്നതിൽ എന്റെ ബയാസ് ഡിറ്റക്ടർ ചെറി-പിക്കിംഗ് (Cherry-Picking) കണ്ടെത്തി

ഞാൻ Biassemble എന്ന പേരിൽ ഒരു പ്രോജക്റ്റ് നിർമ്മിച്ചു.

ഇതിന്റെ ലക്ഷ്യം ലളിതമാണ്. നിങ്ങൾ ഒരു കഥ നൽകുന്നു. അത് ചോദ്യങ്ങൾ ചോദിക്കുന്നു. നിങ്ങളുടെ യുക്തിചിന്തയിലെ കോഗ്നിറ്റീവ് ബയാസുകൾ (cognitive biases) അത് അടയാളപ്പെടുത്തുന്നു.

അന്ന എന്ന സ്ത്രീയെക്കുറിച്ചുള്ള ഒരു കഥ ഉപയോഗിച്ച് ഞാൻ ഇത് പരീക്ഷിച്ചു. ആ കഥയിൽ വസ്തുതകൾ മാത്രമേ ഉണ്ടായിരുന്നുള്ളൂ. അവൾ കാപ്പി കുടിച്ചു. അവൾ ഒരു ബസ്സിൽ കയറി. അവൾ ഓഫീസിലേക്ക് നടന്നുപോയി. ആ വരികളിൽ അഭിപ്രായങ്ങളോ വികാരങ്ങളോ ഉണ്ടായിരുന്നില്ല.

എന്റെ ആദ്യത്തെ പ്രോംപ്റ്റിൽ (prompt) ഒരു നിയമമേ ഉണ്ടായിരുന്നുള്ളൂ: നൽകിയിട്ടുള്ള പട്ടികയിൽ നിന്ന് കുറഞ്ഞത് ഒരു ബയാസ് എങ്കിലും കണ്ടെത്തുക.

ഈ നിയമം എന്തെങ്കിലും ഒന്ന് കണ്ടെത്താൻ സിസ്റ്റത്തെ നിർബന്ധിച്ചു. ഒന്നും ഇല്ലാതിരുന്നിട്ടും, സിസ്റ്റം ഒരു ബയാസ് നിർമ്മിച്ചെടുക്കാൻ ശ്രമിച്ചു.

ഞാൻ പ്രോംപ്റ്റ് 1.0.0 പതിപ്പിലേക്ക് അപ്‌ഡേറ്റ് ചെയ്തു. തെളിവുകൾ വേണമെന്ന നിബന്ധന ഞാൻ കൂട്ടിച്ചേർത്തു. ഒരു ബയാസ് ഉണ്ടെന്ന് തെളിയിക്കാൻ കഥയിലെ പ്രത്യേക ഭാഗങ്ങൾ സിസ്റ്റം ഉദ്ധരിക്കേണ്ടതുണ്ടായി.

ഇത് പ്രശ്നം പരിഹരിക്കുമെന്ന് ഞാൻ കരുതി. പക്ഷേ അത് നടന്നില്ല.

തുടർചോദ്യങ്ങൾക്ക് ഞാൻ "no info" എന്ന് മറുപടി നൽകിയപ്പോൾ, സിസ്റ്റം എന്നെ ചെറി-പിക്കിംഗിന് (Cherry-Picking) കുറ്റപ്പെടുത്തി. ഊഹങ്ങൾ പറയുന്നതിനോടുള്ള എന്റെ വിമുഖത, വിവരങ്ങൾ ഒഴിവാക്കാനുള്ള ബോധപൂർവ്വമായ തീരുമാനമാണെന്ന് അത് വാദിച്ചു.

സാങ്കേതികമായി സിസ്റ്റം പറഞ്ഞത് ശരിയായിരുന്നു. ഞാൻ നാല് തവണ "no info" എന്ന് പറഞ്ഞിരുന്നു. അത് എന്റെ കൃത്യമായ വാക്കുകൾ തന്നെ ഉദ്ധരിച്ചു. എന്നാൽ നിഗമനം തെറ്റായിരുന്നു. വിവരങ്ങളുടെ അഭാവത്തെ അത് യുക്തിപരമായ പിശകായി (reasoning error) മാറ്റി.

ഗ്രൗണ്ടിംഗ് (Grounding) ഉദ്ധരണികളെ സത്യസന്ധമാക്കി. എന്നാൽ അത് നിഗമനങ്ങളെ ശരിയായില്ല.

ഞാൻ പതിപ്പ് 1.1.0 പുറത്തിറക്കി. മൂന്ന് പുതിയ പരിശോധനകൾ ഞാൻ കൂട്ടിച്ചേർത്തു:

തുടക്കത്തിൽ ഒരു സഫിഷ്യൻസി ചെക്ക് (sufficiency check).
തെളിവുകൾ ഒഴിവാക്കുന്നതിനുള്ള നിയമം (evidence-exclusion rule).
കോൺഫിഡൻസ് ത്രെഷോൾഡ് (confidence threshold).

ഫലങ്ങളിൽ മാറ്റം വന്നു. അതേ "no info" മറുപടികൾ നൽകിയിട്ടും പതിപ്പ് 1.1.0 ഒരു ബയാസും റിപ്പോർട്ട് ചെയ്തില്ല. എന്റെ മറുപടികൾ വ്യാഖ്യാനങ്ങളല്ല (interpretive), മറിച്ച് വിവരണാത്മകമാണെന്ന് (descriptive) അത് തിരിച്ചറിഞ്ഞു.

രണ്ട് പതിപ്പുകളും തമ്മിലുള്ള വ്യത്യാസം തെളിവുകളല്ല. "എനിക്കറിയില്ല" (I don't know) എന്നതിനെ സിസ്റ്റം എങ്ങനെ കൈകാര്യം ചെയ്യുന്നു എന്നതിലാണ് വ്യത്യാസം.

ഒരു പതിപ്പ് "എനിക്കറിയില്ല" എന്നതിനെ ഒരു ബയാസിന്റെ ലക്ഷണമായി കാണുന്നു. മറ്റേത് അതിനെ ഒരു സാധുവായ മറുപടിയായി കാണുന്നു. ഇത് എങ്ങനെ കൈകാര്യം ചെയ്യണമെന്ന് നിങ്ങൾ മോഡലിനോട് പറയണം. അത് സ്വയം തീരുമാനിക്കില്ല.

ഇത് പരിശോധിക്കാനായി ഞാൻ ഇപ്പോൾ മെട്രിക്സുകൾ (metrics) നിർമ്മിച്ചുകൊണ്ടിരിക്കുകയാണ്. സിസ്റ്റം യഥാർത്ഥത്തിൽ മെച്ചപ്പെട്ടോ അതോ ഈ പ്രത്യേക കഥയെ അവഗണിക്കാൻ പഠിച്ചോ എന്ന് എനിക്ക് അറിയേണ്ടതുണ്ട്.

ഞാൻ ഒരു ബയാസ് ഡിറ്റക്ടർ നിർമ്മിക്കുകയാണെന്നാണ് കരുതിയത്. പകരം, "എനിക്കറിയില്ല" എന്ന ചോദ്യം വരുമ്പോൾ യുക്തിചിന്താ സംവിധാനങ്ങൾ (reasoning systems) എന്തുകൊണ്ടാണ് ബുദ്ധിമുട്ടുന്നത് എന്ന് ഞാൻ മനസ്സിലാക്കി.

Source: https://dev.to/lemind/my-bias-detector-found-cherry-picking-in-the-answer-no-info-9hf

Optional learning community: https://t.me/GyaanSetuAi

"നോ ഇൻഫോ"-യിലെ ചെറി പിക്കിംഗ് എന്റെ ബയാസ് ഡിറ്റക്ടർ കണ്ടെത്തി

Continue reading

സ്റ്റേക്കിംഗ് കെണി

AI എഴുതാത്ത കോഡ്

𝗬𝗼𝘂𝗿 𝗔𝗜 𝗜𝘀𝗻'𝘁 𝗛𝗮𝗹𝗹𝘂𝗰𝗶𝗻𝗮𝘁𝗶𝗻𝗴. 𝗜𝘁'𝘀 𝗚𝘂𝗲𝘀𝘀𝗶𝗻𝗴.

𝗦𝘁𝗼𝗽 𝗨𝘀𝗶𝗻𝗴 𝗔𝗜 𝗔𝘀 𝗔 𝗦𝗲𝗮𝗿𝗰𝗵 𝗘𝗻𝗴𝗶𝗻𝗲

𝗧𝗵𝗲 𝗔𝗹𝗴𝗼𝗿𝗶𝘁𝗵𝗺𝗶𝗰 𝗖𝗼𝗻𝘀𝘁𝗿𝘂𝗰𝘁𝗶𝗼𝗻 𝗼𝗳 𝗘𝗽𝗶𝘀𝘁𝗲𝗺𝗶𝗰 𝗜𝗻𝗷𝘂𝘀𝘁𝗶𝗰𝗲