𝗖𝗮𝗻 𝗔𝗜 𝗔𝗴𝗲𝗻𝘁𝘀 𝗕𝗲𝗵𝗮𝘃𝗲 𝗟𝗶𝗸𝗲 𝗛𝘂𝗺𝗮𝗻𝘀?

StoryCaptcha പരീക്ഷിക്കാൻ ഞാൻ 12 മണിക്കൂർ ചിലവഴിച്ചു. ഇതൊരു പരീക്ഷണാടിസ്ഥാനത്തിലുള്ള CAPTCHA ആണ്. ഇത് ട്രാഫിക് ലൈറ്റുകൾ കണ്ടെത്താൻ നിങ്ങളോട് ആവശ്യപ്പെടുന്നില്ല. ഒരു പ്രോംപ്റ്റിന്റെ അടിസ്ഥാനത്തിൽ കഥ എഴുതാനാണ് ഇത് നിങ്ങളോട് ആവശ്യപ്പെടുന്നത്. തുടർന്ന് നിങ്ങൾ ഒരു മനുഷ്യനാണോ എന്ന് പരിശോധിക്കാൻ നിങ്ങളുടെ പെരുമാറ്റം വിലയിരുത്തുന്നു.

ഞാൻ Playwright, VS Code, GitHub Copilot, Chromium എന്നിവ ഉപയോഗിച്ചു. ഒരു AI ഏജന്റിന് മനുഷ്യരുടെ രീതികൾ അനുകരിക്കാൻ കഴിയുമോ എന്ന് കാണുക എന്നതായിരുന്നു എന്റെ ലക്ഷ്യം.

എന്റെ ആദ്യ ശ്രമം 56/100 എന്ന സ്കോറോടെ പരാജയപ്പെട്ടു. AI വളരെ കാര്യക്ഷമമായിരുന്നു. അത് ടെക്സ്റ്റ് കോപ്പി ചെയ്ത് പേസ്റ്റ് ചെയ്തു. മടിക്കാതെ അത് ഉടൻ തന്നെ പ്രവർത്തിച്ചു. അത് കൃത്യമായ രീതികൾ പിന്തുടർന്നു. ഓട്ടോമേഷൻ കാര്യക്ഷമമാണ്, പക്ഷേ അത് മനുഷ്യന്റേതല്ല.

StoryCaptcha ട്രാക്ക് ചെയ്യുന്ന മെട്രിക്സുകൾ താഴെ പറയുന്നവയാണ്:

  • ടൈപ്പ് ചെയ്തത് vs പേസ്റ്റ് ചെയ്തത് (Typed vs Pasted)
  • കീസ്ട്രോക്ക് താളം (Keystroke rhythm)
  • ചിന്താപരമായ ഇടവേളകൾ (Cognitive pauses)
  • മൗസ് പാതയിലെ വളവ് (Mouse path curvature)
  • ബാക്ക്‌സ്‌പേസ് ഉപയോഗം (Backspace usage)
  • തിരുത്തുന്ന രീതി (Correction behavior)

ഞാൻ ഏജന്റിനെ ക്രമീകരിക്കാൻ തുടങ്ങി.

ആദ്യം, ഞാൻ ഏജന്റ് പേസ്റ്റ് ചെയ്യുന്നത് നിർത്തി. ഓരോ അക്ഷരമായി ടൈപ്പ് ചെയ്യാൻ ഞാൻ അതിനോട് പറഞ്ഞു. സ്കോർ വർദ്ധിച്ചു.

അടുത്തതായി, ഞാൻ ടൈപ്പിംഗ് വേഗത ക്രമീകരിച്ചു. മനുഷ്യർ കൃത്യമായ സമയക്രമത്തിൽ ടൈപ്പ് ചെയ്യാറില്ല. നമ്മൾ ചിന്തിക്കാൻ ഇടവേളകൾ എടുക്കുന്നു. നമ്മൾ വേഗത കൂട്ടുകയും കുറയ്ക്കുകയും ചെയ്യുന്നു. കീകൾക്കിടയിൽ ഞാൻ ക്രമരഹിതമായ ഇടവേളകൾ ചേർത്തു. സ്കോർ വീണ്ടും വർദ്ധിച്ചു.

പിന്നീട്, ഞാൻ തെറ്റുകൾ വരുത്തി. മനുഷ്യർ വാക്കുകൾ തെറ്റായി എഴുതാറുണ്ട്. അവ തിരുത്താൻ നമ്മൾ ബാക്ക്‌സ്‌പേസ് ഉപയോഗിക്കുന്നു. തെറ്റുകൾ വരുത്താനും അവ തിരുത്താനും ഞാൻ ഏജന്റിന് നിർദ്ദേശം നൽകി. സ്കോർ കൂടുതൽ മെച്ചപ്പെട്ടു.

ഞാൻ മൗസ് ചലനവും മാറ്റി. മനുഷ്യർ മൗസ് നേർരേഖയിൽ ചലിപ്പിക്കാറില്ല. അവർ മൗസ് ചുറ്റിക്കറങ്ങുകയും പരിശോധിക്കുകയും ചെയ്യുന്നു. മൗസ് പാതകളിൽ ഞാൻ വളവുകൾ ചേർത്തു.

എന്റെ സ്കോർ ഉയർന്നപ്പോഴും ഒരു മെട്രിക് 0 ശതമാനത്തിൽ തന്നെ തുടർന്നു. അത് കീ-ഓവർലാപ്പ് (key-overlap) ആയിരുന്നു. മനുഷ്യർ പലപ്പോഴും ഒരു കീ വിടുന്നതിന് മുമ്പ് അടുത്ത കീ അമർത്താറുണ്ട്. മിക്ക ഓട്ടോമേഷനുകളും കൃത്യമായ ക്രമത്തിൽ സിഗ്നലുകൾ അയക്കുന്നു. ഇത് അനുകരിക്കാൻ വളരെ പ്രയാസമുള്ള ഒരു രീതിയാണ്.

എന്റെ ഫലങ്ങൾ:

  • ആദ്യ സ്കോർ: 56
  • ഇടക്കാല സ്കോർ: 60–70
  • മെച്ചപ്പെടുത്തിയ സ്കോർ: 76–77

ഏജന്റ് ഒടുവിൽ വിജയിച്ചു. എന്നാൽ യഥാർത്ഥ പാഠം സ്കോർ ആയിരുന്നില്ല. മിക്ക ആളുകളും ബ്രൗസർ ഫിംഗർപ്രിന്റുകളിലോ ഐപി അഡ്രസ്സുകളിലോ ആണ് ശ്രദ്ധ കേന്ദ്രീകരിക്കുന്നത്. പെരുമാറ്റം എന്നത് ശക്തമായ ഒരു സൂചനയാണെന്ന് ഈ പരീക്ഷണം തെളിയിക്കുന്നു.

നിങ്ങൾ എന്ത് ചെയ്യുന്നു എന്നത് മാത്രമല്ല പ്രധാനം. നിങ്ങൾ അത് എങ്ങനെ ചെയ്യുന്നു എന്നതാണ് പ്രധാനം.

AI ഏജന്റുകൾ വളരുന്നതിനനുസരിച്ച്, പെരുമാറ്റ രീതികൾ തിരിച്ചറിയുന്നത് നിർണ്ണായകമാകും. മനുഷ്യനായിരിക്കുക എന്നതിലെ ഏറ്റവും പ്രയാസകരമായ കാര്യം ചെയ്യുന്ന ജോലികളല്ല. അത് നമ്മുടെ അപൂർണ്ണതയാണ്.

Source: https://dev.to/shahraan_hussain_b42640e7/can-an-ai-agent-behave-like-a-human-a-12-hour-experiment-with-storycaptcha-1661

Optional learning community: https://t.me/GyaanSetuAi