Les agents IA peuvent-ils se comporter comme des humains ?
J'ai passé 12 heures à tester StoryCaptcha. C'est un CAPTCHA expérimental. Il ne vous demande pas de trouver des feux de signalisation. Il vous demande d'écrire une histoire à partir d'une consigne. Il analyse ensuite votre comportement pour voir si vous êtes un humain.
J'ai utilisé Playwright, VS Code, GitHub Copilot et Chromium. Mon objectif était de voir si un agent IA peut imiter les schémas humains.
Mon premier essai a échoué avec un score de 56/100. L'IA était trop efficace. Elle copiait et collait du texte. Elle agissait immédiatement, sans hésitation. Elle suivait des schémas parfaits. L'automatisation est efficace, mais elle n'est pas humaine.
StoryCaptcha vous montre les métriques qu'il suit :
- Saisie au clavier vs Collage
- Rythme de frappe
- Pauses cognitives
- Courbure de la trajectoire de la souris
- Utilisation de la touche retour arrière
- Comportement de correction
J'ai commencé à ajuster l'agent.
D'abord, j'ai empêché l'agent de coller. Je lui ai dit de taper caractère par caractère. Le score a augmenté.
Ensuite, j'ai corrigé la cadence de frappe. Les humains ne tapent pas avec un timing parfait. Nous faisons des pauses pour réfléchir. Nous accélérons et ralentissons. J'ai ajouté des délais aléatoires entre les touches. Le score a encore augmenté.
Ensuite, j'ai ajouté des erreurs. Les humains font des fautes d'orthographe. Nous utilisons la touche retour arrière pour les corriger. J'ai ordonné à l'agent de commettre des erreurs et de les corriger. Le score s'est encore amélioré.
J'ai également modifié le mouvement de la souris. Les humains ne déplacent pas la souris en ligne droite. Ils survolent et explorent. J'ai ajouté de la courbure aux trajectoires de la souris.
Une métrique est restée à 0 % même lorsque mon score a augmenté. Il s'agissait du chevauchement de touches (key-overlap). Les humains appuient souvent sur la touche suivante avant de relâcher la précédente. La plupart des automatisations envoient des signaux parfaitement séquentiels. C'est un schéma très difficile à simuler.
Mes résultats :
- Score initial : 56
- Score intermédiaire : 60–70
- Score optimisé : 76–77
L'agent a fini par réussir. Mais la véritable leçon n'était pas le score. La plupart des gens se concentrent sur l'empreinte du navigateur (browser fingerprint) ou les adresses IP. Cette expérience prouve que le comportement est un signal puissant.
Ce n'est pas seulement ce que vous faites. C'est la manière dont vous le faites.
À mesure que les agents IA se