آیا عامل‌های هوش مصنوعی می‌توانند مانند انسان‌ها رفتار کنند؟

من ۱۲ ساعت را صرف آزمایش StoryCaptcha کردم. این یک CAPTCHA آزمایشی است. از شما نمی‌خواهد چراغ‌های راهنمایی را پیدا کنید. از شما می‌خواهد بر اساس یک دستور (prompt)، داستانی بنویسید. سپس رفتار شما را بررسی می‌کند تا ببیند آیا انسان هستید یا خیر.

من از Playwright، VS Code، GitHub Copilot و Chromium استفاده کردم. هدف من این بود که ببینم آیا یک عامل هوش مصنوعی می‌تواند الگوهای انسانی را تقلید کند یا خیر.

اولین تلاش من با امتیاز ۵۶ از ۱۰۰ شکست خورد. هوش مصنوعی بیش از حد کارآمد بود. متن را کپی و پیست می‌کرد. بدون تردید و بلافاصله عمل می‌کرد. از الگوهای بی‌نقصی پیروی می‌کرد. اتوماسیون کارآمد است، اما انسانی نیست.

StoryCaptcha معیارهایی را که ردیابی می‌کند به شما نشان می‌دهد:

  • تایپ شده در مقابل پیست شده
  • ریتم فشردن کلیدها
  • مکث‌های شناختی
  • انحنای مسیر ماوس
  • میزان استفاده از Backspace
  • رفتار اصلاحی

شروع کردم به تنظیم کردن عامل.

ابتدا، مانع از پیست کردن عامل شدم. به آن گفتم کاراکتر به کاراکتر تایپ کند. امتیاز بالا رفت.

سپس، آهنگ تایپ کردن را اصلاح کردم. انسان‌ها با زمان‌بندی بی‌نقص تایپ نمی‌کنند. ما برای فکر کردن مکث می‌کنیم. سرعت‌مان را کم و زیاد می‌کنیم. تأخیرهای تصادفی بین کلیدها اضافه کردم. امتیاز دوباره بالا رفت.

سپس، اشتباهات را اضافه کردم. انسان‌ها کلمات را اشتباه می‌نویسند. ما از backspace برای اصلاح آن‌ها استفاده می‌کنیم. به عامل دستور دادم که خطا داشته باشد و سپس آن‌ها را اصلاح کند. امتیاز بیشتر بهبود یافت.

همچنین حرکت ماوس را تغییر دادم. انسان‌ها ماوس را در خطوط مستقیم حرکت نمی‌دهند. آن‌ها ماوس را معلق نگه می‌دارند و محیط را جستجو می‌کنند. به مسیرهای ماوس انحنا اضافه کردم.

یک معیار حتی وقتی امتیازم بالا رفت، روی ۰٪ باقی ماند. آن معیار، هم‌پوشانی کلیدها (key-overlap) بود. انسان‌ها اغلب قبل از رها کردن کلید قبلی، کلید بعدی را فشار می‌دهند. بیشتر سیستم‌های اتوماسیون، سیگنال‌های کاملاً متوالی ارسال می‌کنند. جعل این الگو بسیار دشوار است.

نتایج من:

  • امتیاز اولیه: ۵۶
  • امتیاز میانی: ۶۰–۷۰
  • امتیاز بهینه‌سازی شده: ۷۶–۷۷

در نهایت، عامل موفق شد عبور کند. اما درس واقعی، امتیاز نبود. بیشتر مردم روی اثرانگشت مرورگر (browser fingerprints) یا آدرس‌های IP تمرکز می‌کنند. این آزمایش ثابت می‌کند که رفتار، یک سیگنال قدرتمند است.

موضوع فقط این نیست که چه کاری انجام می‌دهید. بلکه موضوع این است که چگونه آن را انجام می‌دهید.

با رشد عامل‌های هوش مصنوعی، تشخیص رفتاری حیاتی خواهد شد. سخت‌ترین بخش انسان بودن، انجام وظایف نیست. بلکه نقص‌ها و بی‌نقص نبودن است.

Source: https://dev.to/shahraan_hussain_b42640e7/can-an-ai-agent-behave-like-a-human-a-12-hour-experiment-with-storycaptcha-1661

Optional learning community: https://t.me/GyaanSetuAi