AI கண்டறியும் கருவிகள் யூகங்களை மட்டுமே செய்கின்றன

AI கண்டறியும் கருவிகள் பெரும்பாலும் மனிதர்கள் எழுதியவற்றை இயந்திரம் உருவாக்கியது என்று தவறாகக் குறிப்பிடுகின்றன. பல நிறுவனங்கள் வேலைவாய்ப்பு அல்லது மதிப்பெண் வழங்குவதற்காக இந்தத் கருவிகளைப் பயன்படுத்துகின்றன. அவை வழங்கும் மதிப்பெண்ணை ஒரு உண்மையாகக் கருதுகின்றன. ஆனால் அது உண்மை அல்ல.

இந்தத் கருவிகள் உங்கள் உரையின் பொருளைப் புரிந்துகொள்வதில்லை. இயந்திரம் உருவாக்கிய வெளியீட்டின் சாத்தியக்கூறுகளைக் கணிக்க இவை கணிதத்தைப் பயன்படுத்துகின்றன.

அவை மூன்று முக்கிய விஷயங்களைக் கவனிக்கின்றன:

  • Perplexity (குழப்பநிலை): இது உங்கள் சொற்கள் எவ்வளவு கணிக்கக்கூடியவை என்பதை அளவிடுகிறது. AI அடுத்ததாக வரக்கூடிய மிகவும் சாத்தியமான சொல்லைத் தேர்ந்தெடுக்கும். மனித எழுத்து பெரும்பாலும் எதிர்பாராததாக இருக்கும். குறைந்த Perplexity கொண்ட எழுத்து AI போலத் தோன்றும்.
  • Burstiness (வேக மாறுபாடு): இது வாக்கியங்களின் மாறுபாட்டை அளவிடுகிறது. மனிதர்கள் குறுகிய மற்றும் நீண்ட வாக்கியங்களைச் கலந்து எழுதுவார்கள். AI பெரும்பாலும் ஒரு சீரான தாளத்தைப் பயன்படுத்துகிறது. குறைந்த மாறுபாடு கொண்ட எழுத்து AI போலத் தோன்றும்.
  • Classifiers (வகைப்படுத்திகள்): இந்த மாதிரிகள் மனித மற்றும் இயந்திர மாதிரிகளை ஆய்வு செய்கின்றன. அவை வடிவங்களின் அடிப்படையில் யூகிக்கின்றன. மாதிரி ஒரு புதிய எழுத்து முறையைக் கண்டால், அது தோல்வியடைகிறது.

Watermarking என்பது மற்றொரு முறையாகும். இது சொற்கள் தேர்வில் மறைமுகமான வடிவங்களை உருவாக்குகிறது. யாராவது உரையைத் திருத்தினால் அல்லது மாற்றி எழுதினால் (paraphrase) இந்த முறை தோல்வியடையும்.

இந்தத் கருவிகளில் கடுமையான குறைபாடுகள் உள்ளன:

  • சிறந்த எழுத்து AI போலத் தோன்றும். தெளிவான, எளிமையான மற்றும் கட்டமைக்கப்பட்ட உரை குறைந்த Perplexity-ஐக் கொண்டிருக்கும். நீங்கள் எவ்வளவு சிறப்பாக எழுதுகிறீர்களோ, அவ்வளவு அதிகமாக ஒரு கருவிக்கு நீங்கள் இயந்திரத்தனமாகத் தெரிவீர்கள்.
  • ஆங்கிலத்தைத் தாய்மொழியாகக் கொண்டவர்கள் அல்லாதவர்களுக்கு எதிரான சார்புநிலை. ஸ்டான்போர்டு ஆய்வு ஒன்று, ஆங்கிலத்தைத் தாய்மொழியாகக் கொண்டவர்கள் அல்லாதவர்களைக் கண்டறியும் கருவிகள் அடிக்கடி தவறாகக் குறிப்பிடுவதைக் கண்டறிந்துள்ளது. எளிமையான சொற்றொடர்கள் இந்தத் கருவிகளுக்கு இயந்திர வெளியீடு போலத் தோன்றுகின்றன.
  • ஏமாற்றுவது எளிது. சில ஒத்த சொற்கள் அல்லது சிறிய மாற்றங்கள் கண்டறியும் கருவியைத் திசைதிருப்பும். இது நேர்மையான எழுத்தாளர்களுக்குத் தண்டனை அளிப்பதுடன், குறைந்த முயற்சியுடன் AI பயன்படுத்துபவர்களைத் தடையின்றிச் செல்ல அனுமதிக்கிறது.

துல்லியமாக இல்லாத காரணத்தால் OpenAI கூட 2023 இல் தனது சொந்தக் கண்டறியும் கருவியைப் பயன்படுத்துவதை நிறுத்திவிட்டது. உருவாக்குபவர்களாலேயே தங்கள் சொந்த AI-ஐக் கண்டறிய முடியாவிட்டால், அதிக துல்லியத்தைக் கூறும் மூன்றாம் தரப்பு கருவிகளை நம்பாதீர்கள்.

இந்த மதிப்பெண்களைப் பாதுகாப்பாகப் பயன்படுத்துவது எப்படி:

  • ஒரு மதிப்பெண்ணை மட்டும் வைத்து முடிவெடுக்காதீர்கள். தவறான குற்றச்சாட்டு மாணவர்களுக்கோ அல்லது வேலை தேடுபவர்களுக்கோ உண்மையான பாதிப்பை ஏற்படுத்தும்.
  • செயல்முறையைச் சரிபார்க்கவும். ஒரு சாத்தியக்கூறு மதிப்பெண்ணுக்குப் பதிலாக, திருத்த வரலாறு (edit history) மற்றும் வரைவுகளைப் (drafts) பார்க்கவும்.
  • நிச்சயமற்ற தன்மையைக் காட்டவும். நீங்கள் இந்தக் கருவிகளைப் பயன்படுத்தினால், மனிதன் அல்லது AI என்ற இருமுனை லேபிளுக்குப் பதிலாக, நம்பிக்கையின் வரம்பைக் (range of confidence) காட்டவும்.

AI கண்டறியும் கருவிகள் வடிவங்களை ஒப்பிடும் கருவிகள் மட்டுமே. அவை குறிப்புகளைப் பெறப் பயனுள்ளதாக இருக்கலாம், ஆனால் ஆதாரமாகப் பயன்படுத்துவது ஆபத்தானது.

Source: https://dev.to/ricco020/ai-text-detectors-are-mostly-guessing-how-they-actually-work-2ibl

Optional learning community: https://t.me/GyaanSetuAi