𝗔𝗜 𝗔𝗴𝗲𝗻𝘁𝗹𝗲𝗿𝗶 𝗜𝗻𝘀𝗮𝗻𝗹𝗮𝗿 𝗚𝗶𝗯𝗶 𝗗𝗮𝘃𝗿𝗮𝗻𝗮𝗯𝗶𝗹𝗶𝗿 𝗺𝗶?

StoryCaptcha'yı test etmek için 12 saat harcadım. Bu, deneysel bir CAPTCHA. Sizden trafik ışıklarını bulmanızı istemiyor. Bir prompt'a dayanarak bir hikaye yazmanızı istiyor. Ardından, insan olup olmadığınızı anlamak için davranışlarınızı kontrol ediyor.

Playwright, VS Code, GitHub Copilot ve Chromium kullandım. Amacım, bir AI ajanının insan kalıplarını taklit edip edemeyeceğini görmekti.

İlk denemem 56/100 puanla başarısız oldu. AI çok verimliydi. Metni kopyalayıp yapıştırıyordu. Hiç tereddüt etmeden anında hareket ediyordu. Kusursuz kalıplar izliyordu. Otomasyon verimlidir ancak insan değildir.

StoryCaptcha takip ettiği metrikleri size gösteriyor:

  • Yazılan vs Yapıştırılan
  • Tuş vuruşu ritmi
  • Bilişsel duraksamalar
  • Fare yolu eğriliği
  • Backspace kullanımı
  • Düzeltme davranışı

Ajanı ayarlamaya başladım.

İlk olarak, ajanın yapıştırma yapmasını engelledim. Ona karakter karakter yazmasını söyledim. Puan yükseldi.

Sonra, yazma temposunu düzelttim. İnsanlar mükemmel bir zamanlamayla yazmazlar. Düşünmek için duraksarız. Hızlanırız ve yavaşlarız. Tuşlar arasına rastgele gecikmeler ekledim. Puan tekrar yükseldi.

Sonra hatalar ekledim. İnsanlar kelimeleri yanlış yazar. Onları düzeltmek için backspace kullanırız. Ajanın hatalar yapmasını ve bunları düzeltmesini talimatlandırdım. Puan daha da iyileşti.

Fare hareketini de değiştirdim. İnsanlar fareyi düz çizgiler halinde hareket ettirmezler. Fareyi üzerinde gezdirir ve keşfederler. Fare yollarına eğrilik ekledim.

Puanım yükselmesine rağmen bir metrik %0'da kaldı. Bu, tuş çakışmasıydı (key-overlap). İnsanlar genellikle son tuşu bırakmadan önce bir sonraki tuşa basarlar. Çoğu otomasyon mükemmel derecede sıralı sinyaller gönderir. Bu, taklit edilmesi çok zor bir kalıptır.

Sonuçlarım:

  • Başlangıç puanı: 56
  • Ara puan: 60–70
  • Optimize edilmiş puan: 76–77

Ajan sonunda başarılı oldu. Ancak asıl ders puan değildi. Çoğu insan tarayıcı parmak izlerine veya IP adreslerine odaklanır. Bu deney, davranışın güçlü bir sinyal olduğunu kanıtlıyor.

Mesele sadece ne yaptığınız değil. Nasıl yaptığınızdır.

AI ajanları geliştikçe, davranışsal tespit hayati bir önem kazanacak. İnsan olmanın en zor kısmı görev değil. Kusurluluktur.

Source: https://dev.to/shahraan_hussain_b42640e7/can-an-ai-agent-behave-like-a-human-a-12-hour-experiment-with-storycaptcha-1661

Optional learning community: https://t.me/GyaanSetuAi