¿Pueden los agentes de IA comportarse como humanos?

Pasé 12 horas probando StoryCaptcha. Es un CAPTCHA experimental. No te pide que busques semáforos. Te pide que escribas una historia basada en un prompt. Luego analiza tu comportamiento para ver si eres humano.

Utilicé Playwright, VS Code, GitHub Copilot y Chromium. Mi objetivo era ver si un agente de IA puede imitar patrones humanos.

Mi primera ejecución falló con una puntuación de 56/100. La IA era demasiado eficiente. Copiaba y pegaba texto. Actuaba de inmediato y sin vacilación. Seguía patrones perfectos. La automatización es eficiente, pero no es humana.

StoryCaptcha te muestra las métricas que rastrea:

  • Escrito vs Pegado
  • Ritmo de pulsación de teclas
  • Pausas cognitivas
  • Curvatura de la trayectoria del ratón
  • Uso de la tecla de retroceso (backspace)
  • Comportamiento de corrección

Comencé a ajustar el agente.

Primero, evité que el agente pegara texto. Le ordené que escribiera carácter por carácter. La puntuación subió.

Después, ajusté la cadencia de escritura. Los humanos no escriben con un ritmo perfecto. Hacemos pausas para pensar. Aceleramos y desaceleramos. Añadí retrasos aleatorios entre teclas. La puntuación volvió a subir.

Luego, añadí errores. Los humanos escriben mal las palabras. Usamos la tecla de retroceso para corregirlas. Instruí al agente para que cometiera errores y los corrigiera. La puntuación mejoró aún más.

También cambié el movimiento del ratón. Los humanos no mueven el ratón en línea recta. Se desplazan y exploran. Añadí curvatura a las trayectorias del ratón.

Una métrica se mantuvo en el 0% incluso cuando mi puntuación aumentó. Era el solapamiento de teclas (key-overlap). Los humanos suelen presionar la siguiente tecla antes de soltar la anterior. La mayoría de las automatizaciones envían señales perfectamente secuenciales. Este es un patrón muy difícil de falsificar.

Mis resultados:

  • Puntuación inicial: 56
  • Puntuación intermedia: 60–70
  • Puntuación optimizada: 76–77

El agente finalmente lo logró. Pero la verdadera lección no fue la puntuación. La mayoría de la gente se centra en las huellas digitales del navegador (fingerprinting) o en las direcciones IP. Este experimento demuestra que el comportamiento es una señal poderosa.

No es solo lo que haces. Es cómo lo haces.

A medida que los agentes de IA crezcan, la detección de comportamiento se volverá vital. La parte más difícil de ser humano no es la tarea. Es la imperfección.

Fuente: https://dev.to/shahraan_hussain_b42640e7/can-an-ai-agent-behave-like-a-human-a-12-hour-experiment-with-storycaptcha-1661

Comunidad de aprendizaje opcional: https://t.me/GyaanSetuAi