AI ஏஜென்ட்கள் மனிதர்களைப் போல செயல்பட முடியுமா?

StoryCaptcha-வைச் சோதிக்க நான் 12 மணிநேரம் செலவிட்டேன். இது ஒரு சோதனை ரீதியான CAPTCHA. இது போக்குவரத்து விளக்குகளைக் கண்டறியச் சொல்லாது. ஒரு குறிப்பின் (prompt) அடிப்படையில் ஒரு கதையை எழுத இது உங்களிடம் கேட்கும். பிறகு நீங்கள் மனிதரா என்பதை அறிய, அது உங்கள் நடத்தையைச் சோதிக்கும்.

நான் Playwright, VS Code, GitHub Copilot மற்றும் Chromium ஆகியவற்றைப் பயன்படுத்தினேன். ஒரு AI ஏஜென்ட் மனிதர்களின் செயல்பாடுகளைப் போலப் பின்பற்ற முடியுமா என்பதைக் கண்டறிவதே எனது இலக்காக இருந்தது.

எனது முதல் முயற்சி 56/100 மதிப்பெண்ணுடன் தோல்வியடைந்தது. AI மிகவும் திறமையாகச் செயல்பட்டது. அது உரையை நகலெடுத்து ஒட்டின (copy and paste). தயக்கமின்றி உடனடியாகச் செயல்பட்டது. அது துல்லியமான முறைகளைப் பின்பற்றியது. தானியங்கி முறை (Automation) திறமையானது, ஆனால் அது மனிதத்தன்மை வாய்ந்தது அல்ல.

StoryCaptcha தான் கண்காணிக்கும் அளவீடுகளை (metrics) உங்களுக்குக் காட்டுகிறது:

  • தட்டச்சு செய்ததா அல்லது ஒட்டப்பட்டதா (Typed vs Pasted)
  • விசைப்பலகை தட்டச்சுத் தாளம் (Keystroke rhythm)
  • சிந்தனை இடைவெளிகள் (Cognitive pauses)
  • மவுஸ் பாதையின் வளைவு (Mouse path curvature)
  • Backspace பயன்பாடு
  • திருத்தும் முறை (Correction behavior)

நான் ஏஜென்ட்டை மாற்றியமைக்கத் தொடங்கினேன்.

முதலில், ஏஜென்ட் ஒட்டும் (pasting) முறையைத் தடுத்தேன். ஒவ்வொரு எழுத்தாகத் தட்டச்சு செய்யுமாறு அதனிடம் கூறினேன். மதிப்பெண் உயர்ந்தது.

அடுத்து, தட்டச்சு செய்யும் வேகத்தைச் சரி செய்தேன். மனிதர்கள் துல்லியமான கால இடைவெளியுடன் தட்டச்சு செய்வதில்லை. நாம் யோசிக்க இடைவெளி விடுவோம். நாம் வேகமாகவும் மெதுவாகவும் தட்டச்சு செய்வோம். விசைகளுக்கு இடையே சீரற்ற காலதாமதங்களைச் சேர்த்தேன். மதிப்பெண் மீண்டும் உயர்ந்தது.

பிறகு, தவறுகளைச் சேர்த்தேன். மனிதர்கள் சொற்களைத் தவறாக எழுதுவார்கள். அவற்றைச் சரிசெய்ய நாம் backspace பயன்படுத்துகிறோம். தவறுகளைச் செய்து அவற்றைச் சரிசெய்யுமாறு ஏஜென்ட்டிற்கு அறிவுறுத்தினேன். மதிப்பெண் மேலும் உயர்ந்தது.

மவுஸ் நகர்வையும் மாற்றினேன். மனிதர்கள் மவுஸை நேர்க்கோட்டில் நகர்த்துவதில்லை. அவர்கள் மவுஸை அங்கும் இங்கும் நகர்த்திப் பார்ப்பார்கள். மவுஸ் பாதைகளில் வளைவுகளைச் சேர்த்தேன்.

எனது மதிப்பெண் உயர்ந்த போதும், ஒரு அளவீடு 0%-லேயே இருந்தது. அது key-overlap. மனிதர்கள் பெரும்பாலும் ஒரு விசையை விடுவதற்கு முன்பே அடுத்த விசையை அழுத்துவார்கள். பெரும்பாலான தானியங்கி முறைகள் துல்லியமான வரிசைமுறை சிக்னல்களை அனுப்புகின்றன. இதை போலியல pretend செய்வது மிகவும் கடினம்.

எனது முடிவுகள்:

  • ஆரம்ப மதிப்பெண்: 56
  • இடைப்பட்ட மதிப்பெண்: 60–70
  • மேம்படுத்தப்பட்ட மதிப்பெண்: 76–77

இறுதியில் ஏஜென்ட் தேர்ச்சி பெற்றது. ஆனால் உண்மையான பாடம் மதிப்பெண் அல்ல. பெரும்பாலான மக்கள் பிரவுசர் ஃபிங்கர் பிரிண்ட்கள் (browser fingerprints) அல்லது IP முகவரிகளில் கவனம் செலுத்துகிறார்கள். நடத்தை என்பது ஒரு சக்திவாய்ந்த அறிகுறி என்பதை இந்தச் சோதனை நிரூபிக்கிறது.

நீங்கள் என்ன செய்கிறீர்கள் என்பது மட்டுமல்ல. அதை எப்படிச் செய்கிறீர்கள் என்பதுதான் முக்கியம்.

AI ஏஜென்ட்கள் பெருகும்போது, நடத்தை கண்டறிதல் (behavioral detection) மிக முக்கியமானதாக மாறும். மனிதனாக இருப்பதன் கடினமான பகுதி ஒரு வேலையைச் செய்வது அல்ல. அது அந்த முழுமையற்ற தன்மைதான் (imperfection).

Source: https://dev.to/shahraan_hussain_b42640e7/can-an-ai-agent-behave-like-a-human-a-12-hour-experiment-with-storycaptcha-1661

விருப்பமான கற்றல் சமூகம்: https://t.me/GyaanSetuAi