Чи можуть ШІ-агенти поводитися як люди?
Я витратив 12 годин на тестування StoryCaptcha. Це експериментальна CAPTCHA. Вона не просить вас шукати світлофори. Вона просить вас написати історію на основі промпту. Потім вона перевіряє вашу поведінку, щоб визначити, чи ви людина.
Я використовував Playwright, VS Code, GitHub Copilot та Chromium. Моєю метою було дізнатися, чи може ШІ-агент імітувати людські патерни.
Мій перший запуск провалився з результатом 56/100. ШІ був занадто ефективним. Він копіював і вставляв текст. Він діяв миттєво, без вагань. Він дотримувався ідеальних патернів. Автоматизація ефективна, але вона не є людською.
StoryCaptcha показує метрики, які вона відстежує:
- Набрано текстом проти вставленого
- Ритм натискання клавіш
- Когнітивні паузи
- Кривизна траєкторії миші
- Використання Backspace
- Поведінка під час виправлення
Я почав налаштовувати агента.
Спочатку я заборонив агенту вставляти текст. Я наказав йому друкувати символ за символом. Результат зріс.
Далі я налаштував темп друку. Люди не друкують з ідеальним таймінгом. Ми робимо паузи, щоб подумати. Ми прискорюємося і сповільнюємося. Я додав випадкові затримки між натисканнями клавіш. Результат знову зріс.
Потім я додав помилки. Люди роблять помилки у словах. Ми використовуємо Backspace, щоб їх виправити. Я наказав агенту робити помилки та виправляти їх. Результат покращився ще більше.
Я також змінив рух миші. Люди не рухають мишею по прямих лініях. Вони затримуються на місці та досліджують простір. Я додав кривизну траєкторіям руху миші.
Одна метрика залишалася на рівні 0%, навіть коли мій результат зростав. Це було накладання клавіш (key-overlap). Люди часто натискають наступну клавішу ще до того, як відпускають попередню. Більшість систем автоматизації надсилають ідеально послідовні сигнали. Цей патерн дуже важко підробити.
Мої результати:
- Початковий результат: 56
- Проміжний результат: 60–70
- Оптимізований результат: 76–77
Зрештою агент пройшов перевірку. Але справжнім уроком був не результат. Більшість людей зосереджуються на відбитках браузера (browser fingerprints) або IP-адресах. Цей експеримент доводить, що поведінка є потужним сигналом.
Важливо не лише те, що ви робите. Важливо те, як ви це робите.
З розвитком ШІ-агентів поведінкове виявлення стане життєво важливим. Найскладніше в тому, щоб бути людиною, — це не виконання завдань. Це недосконалість.
Optional learning community: https://t.me/GyaanSetuAi