AI கண்டறியும் கருவிகள் யூகங்களை மட்டுமே செய்கின்றன
AI கண்டறியும் கருவிகள் பெரும்பாலும் மனிதர்கள் எழுதியவற்றை இயந்திரம் உருவாக்கியது என்று தவறாகக் குறிப்பிடுகின்றன. பல நிறுவனங்கள் வேலைவாய்ப்பு அல்லது மதிப்பெண் வழங்குவதற்காக இந்தத் கருவிகளைப் பயன்படுத்துகின்றன. அவை வழங்கும் மதிப்பெண்ணை ஒரு உண்மையாகக் கருதுகின்றன. ஆனால் அது உண்மை அல்ல.
இந்தத் கருவிகள் உங்கள் உரையின் பொருளைப் புரிந்துகொள்வதில்லை. இயந்திரம் உருவாக்கிய வெளியீட்டின் சாத்தியக்கூறுகளைக் கணிக்க இவை கணிதத்தைப் பயன்படுத்துகின்றன.
அவை மூன்று முக்கிய விஷயங்களைக் கவனிக்கின்றன:
- Perplexity (குழப்பநிலை): இது உங்கள் சொற்கள் எவ்வளவு கணிக்கக்கூடியவை என்பதை அளவிடுகிறது. AI அடுத்ததாக வரக்கூடிய மிகவும் சாத்தியமான சொல்லைத் தேர்ந்தெடுக்கும். மனித எழுத்து பெரும்பாலும் எதிர்பாராததாக இருக்கும். குறைந்த Perplexity கொண்ட எழுத்து AI போலத் தோன்றும்.
- Burstiness (வேக மாறுபாடு): இது வாக்கியங்களின் மாறுபாட்டை அளவிடுகிறது. மனிதர்கள் குறுகிய மற்றும் நீண்ட வாக்கியங்களைச் கலந்து எழுதுவார்கள். AI பெரும்பாலும் ஒரு சீரான தாளத்தைப் பயன்படுத்துகிறது. குறைந்த மாறுபாடு கொண்ட எழுத்து AI போலத் தோன்றும்.
- Classifiers (வகைப்படுத்திகள்): இந்த மாதிரிகள் மனித மற்றும் இயந்திர மாதிரிகளை ஆய்வு செய்கின்றன. அவை வடிவங்களின் அடிப்படையில் யூகிக்கின்றன. மாதிரி ஒரு புதிய எழுத்து முறையைக் கண்டால், அது தோல்வியடைகிறது.
Watermarking என்பது மற்றொரு முறையாகும். இது சொற்கள் தேர்வில் மறைமுகமான வடிவங்களை உருவாக்குகிறது. யாராவது உரையைத் திருத்தினால் அல்லது மாற்றி எழுதினால் (paraphrase) இந்த முறை தோல்வியடையும்.
இந்தத் கருவிகளில் கடுமையான குறைபாடுகள் உள்ளன:
- சிறந்த எழுத்து AI போலத் தோன்றும். தெளிவான, எளிமையான மற்றும் கட்டமைக்கப்பட்ட உரை குறைந்த Perplexity-ஐக் கொண்டிருக்கும். நீங்கள் எவ்வளவு சிறப்பாக எழுதுகிறீர்களோ, அவ்வளவு அதிகமாக ஒரு கருவிக்கு நீங்கள் இயந்திரத்தனமாகத் தெரிவீர்கள்.
- ஆங்கிலத்தைத் தாய்மொழியாகக் கொண்டவர்கள் அல்லாதவர்களுக்கு எதிரான சார்புநிலை. ஸ்டான்போர்டு ஆய்வு ஒன்று, ஆங்கிலத்தைத் தாய்மொழியாகக் கொண்டவர்கள் அல்லாதவர்களைக் கண்டறியும் கருவிகள் அடிக்கடி தவறாகக் குறிப்பிடுவதைக் கண்டறிந்துள்ளது. எளிமையான சொற்றொடர்கள் இந்தத் கருவிகளுக்கு இயந்திர வெளியீடு போலத் தோன்றுகின்றன.
- ஏமாற்றுவது எளிது. சில ஒத்த சொற்கள் அல்லது சிறிய மாற்றங்கள் கண்டறியும் கருவியைத் திசைதிருப்பும். இது நேர்மையான எழுத்தாளர்களுக்குத் தண்டனை அளிப்பதுடன், குறைந்த முயற்சியுடன் AI பயன்படுத்துபவர்களைத் தடையின்றிச் செல்ல அனுமதிக்கிறது.
துல்லியமாக இல்லாத காரணத்தால் OpenAI கூட 2023 இல் தனது சொந்தக் கண்டறியும் கருவியைப் பயன்படுத்துவதை நிறுத்திவிட்டது. உருவாக்குபவர்களாலேயே தங்கள் சொந்த AI-ஐக் கண்டறிய முடியாவிட்டால், அதிக துல்லியத்தைக் கூறும் மூன்றாம் தரப்பு கருவிகளை நம்பாதீர்கள்.
இந்த மதிப்பெண்களைப் பாதுகாப்பாகப் பயன்படுத்துவது எப்படி:
- ஒரு மதிப்பெண்ணை மட்டும் வைத்து முடிவெடுக்காதீர்கள். தவறான குற்றச்சாட்டு மாணவர்களுக்கோ அல்லது வேலை தேடுபவர்களுக்கோ உண்மையான பாதிப்பை ஏற்படுத்தும்.
- செயல்முறையைச் சரிபார்க்கவும். ஒரு சாத்தியக்கூறு மதிப்பெண்ணுக்குப் பதிலாக, திருத்த வரலாறு (edit history) மற்றும் வரைவுகளைப் (drafts) பார்க்கவும்.
- நிச்சயமற்ற தன்மையைக் காட்டவும். நீங்கள் இந்தக் கருவிகளைப் பயன்படுத்தினால், மனிதன் அல்லது AI என்ற இருமுனை லேபிளுக்குப் பதிலாக, நம்பிக்கையின் வரம்பைக் (range of confidence) காட்டவும்.
AI கண்டறியும் கருவிகள் வடிவங்களை ஒப்பிடும் கருவிகள் மட்டுமே. அவை குறிப்புகளைப் பெறப் பயனுள்ளதாக இருக்கலாம், ஆனால் ஆதாரமாகப் பயன்படுத்துவது ஆபத்தானது.
Source: https://dev.to/ricco020/ai-text-detectors-are-mostly-guessing-how-they-actually-work-2ibl
Optional learning community: https://t.me/GyaanSetuAi