Yanlılık Tespit Edicim "Bilgi Yok" Yanıtında Cherry-Picking Tespit Etti

Biassemble adında bir proje geliştirdim.

Amaç basit. Ona bir hikaye veriyorsunuz. O da sorular soruyor. Akıl yürütme biçiminizdeki bilişsel yanlılıkları işaretliyor.

Bunu Anna adında bir kadınla ilgili bir hikaye ile test ettim. Hikayesi sadece gerçeklerden oluşuyordu. Kahve içti. Otobüse bindi. Ofisine yürüdü. Metinde hiçbir görüş veya duygu yoktu.

İlk istemimin (prompt) tek bir kuralı vardı: Bir listeden en az bir yanlılık tespit et.

Bu kural, sistemi bir şeyler bulmaya zorladı. Hiçbir şey mevcut olmadığında bile sistem bir yanlılık uydurmaya çalıştı.

İstemi 1.0.0 sürümüne güncelledim. Kanıt gereksinimi ekledim. Sistemin, bir yanlılığın var olduğunu kanıtlamak için hikayenin belirli kısımlarına atıfta bulunması gerekiyordu.

Bunun sorunu çözdüğünü sandım. Çözmedi.

Takip sorularına "bilgi yok" (no info) yanıtını verdiğimde, sistem beni Cherry-Picking ile işaretledi. Tahminde bulunmayı reddetmemin, verileri atlamak için yapılmış kasıtlı bir seçim olduğunu savundu.

Sistem teknik olarak haklıydı. Dört kez "bilgi yok" demiştim. Tam olarak kullandığım kelimelere atıfta bulundu. Ancak sonuç yanlıştı. Bilgi eksikliğini bir akıl yürütme hatasına dönüştürdü.

Dayanaklandırma (grounding), atıfları dürüst kıldı. Ancak sonuçları doğru yapmadı.

1.1.0 sürümünü yayınladım. Üç yeni kontrol ekledim:

Sonuçlar değişti. Aynı "bilgi yok" yanıtlarıyla, 1.1.0 sürümü herhangi bir yanlılık rapor etmedi. Yanıtlarımın yorumlayıcı olmaktan ziyade betimleyici olduğunu fark etti.

İki sürüm arasındaki fark kanıt değil. Fark, sistemin "bilmiyorum" ifadesine nasıl yaklaştığıdır.

Bir sürüm "bilmiyorum"u bir yanlılık belirtisi olarak görüyor. Diğeri ise bunu geçerli bir yanıt olarak görüyor. Modele bunu nasıl ele alacağını söylemelisiniz. Kendi başına karar vermeyecektir.

Şimdi bunu test etmek için metrikler oluşturuyorum. Sistemin gerçekten gelişip gelişmediğini yoksa sadece bu özel hikayeyi görmezden gelmeyi mi öğrendiğini bilmem gerekiyor.

Bir yanlılık tespit edici inşa ettiğimi sanıyordum. Bunun yerine, akıl yürütme sistemlerinin neden "bilmiyorum" konusunda zorlandığını öğrendim.

Kaynak: https://dev.to/lemind/my-bias-detector-found-cherry-picking-in-the-answer-no-info-9hf

İsteğe bağlı öğrenme topluluğu: https://t.me/GyaanSetuAi