AI கண்டறிதலின் நம்பகத்தன்மை நெருக்கடி: சில கருவிகள் வெற்றி பெறுகின்றன, மற்றவை முற்றிலும் தோல்வியடைகின்றன

Translated for your language. Read the original.

AI-assisted draft.

GyaanSetu Editorialகடந்த வாரம்3min read

In this article

AI கண்டறிதலின் நம்பகத்தன்மை நெருக்கடி: சில கருவிகள் வெற்றி பெறுகின்றன, மற்றவை முற்றிலும் தோல்வியடைகின்றன

Authors Guild நடத்திய சமீபத்திய ஆய்வு, AI எழுத்து கண்டறியும் கருவிகளின் நம்பகத்தன்மையில் உள்ள மிகப்பெரிய வேறுபாட்டை வெளிப்படுத்தியுள்ளது. சில கருவிகள் மிகவும் துல்லியமாக இருக்கும் அதே வேளையில், மற்றவை அடிப்படையிலேயே குறைபாடுடையவை என்பதை இது காட்டுகிறது. தங்கள் படைப்புகள் மனிதர்களால் உருவாக்கப்பட்டவை என்பதை நிரூபிப்பதன் மூலம் வாழ்வாதாரம் பெற வேண்டியிருக்கும் தொழில்முறை எழுத்தாளர்களுக்கு இந்த நிலையற்ற தன்மை ஒரு குறிப்பிடத்தக்க அச்சுறுத்தலை ஏற்படுத்துகிறது.

செயல்திறன் இடைவெளி: முழுமையான துல்லியம் முதல் முழுமையான தோல்வி வரை

உருவாக்கும் AI (generative AI) ஒரு முக்கியப் போக்காக மாறுவதற்கு பல ஆண்டுகளுக்கு முன்பே, அதாவது 2020 மற்றும் 2022-க்கு இடையில் வெளியிடப்பட்ட பத்து கட்டுரைகளைப் பயன்படுத்தி Authors Guild ஒரு கடுமையான சோதனையை நடத்தியது. "AI-க்கு முந்தைய" மனித உரையைப் பயன்படுத்துவதன் மூலம், தவறான நேர்மறை விகிதங்களை (false positive rates) அளவிட இந்த ஆய்வு ஒரு தெளிவான அடிப்படையை வழங்கியது.

முடிவுகள் முரண்பட்டதாக இருந்தன. Pangram மற்றும் Grammarly ஆகியவை மிகவும் நம்பகமானவையாக உருவெடுத்தன; அவை மனிதர்களால் எழுதப்பட்ட ஒவ்வொரு உரையும் மனிதாவே என்பதைச் சரியாகக் கண்டறிந்தன (0.0% AI மதிப்பெண்). Originality.ai என்பதும் அனைத்துத் தரங்களிலும் அதிக துல்லியத்தைப் பேணுவதன் மூலம் வலுவாகச் செயல்பட்டது.

இதற்கு நேர்மாறாக, Sidekicker.ai மிக மோசமாகத் தோல்வியடைந்தது. சோதனையில் இருந்த ஒவ்வொரு மனிதக் கட்டுரையும் "பெரும்பாலும் AI மூலம் உருவாக்கப்பட்டது" என்று அடையாளப்படுத்தப்பட்டது; இதில் இரண்டு குறிப்பிட்ட கட்டுரைகள் 100% AI மதிப்பெண்ணைப் பெற்றன. ZeroGPT என்பதும் நம்பகமற்றது என்று நிரூபிக்கப்பட்டது; "Erdrich Pulitzer Prize" கட்டுரை போன்ற சந்தேகத்திற்கு இடமில்லாத மனிதத் தரவுகளுக்கும், இது அடிக்கடி அதிக AI சதவீதத்தைக் காட்டியது (அந்தக் கட்டுரையை 76.3% AI சாத்தியக்கூறு கொண்டதாகக் குறிப்பிட்டது).

தொழில்முறை எழுத்தின் முரண்

இந்த ஆய்வு ஒரு கவலையளிக்கும் தொழில்நுட்ப முரண்பாட்டைக் கோடிட்டுக் காட்டுகிறது: ஒரு மனித எழுத்தாளர் எவ்வளவு திறமையானவராக இருக்கிறாரோ, அவ்வளவு அதிகமாக அவர் தவறான கண்டறியும் கருவிகளால் அடையாளப்படுத்தப்பட வாய்ப்புள்ளது. தொழில்முறை எழுத்து என்பது தெளிவு, சுருக்கம் மற்றும் துல்லியம் ஆகியவற்றின் அடிப்படையில் அமைகிறது—இவைதான் Large Language Models (LLMs) அப்படியே பிரதிபலிக்கப் பயிற்சி அளிக்கப்பட்ட துல்லியமான புள்ளிவிவர முறைகளாகும்.

AI மாதிரிகள் உயர்தர மனித உரைநடையில் பயிற்சி அளிக்கப்படுவதால், ஒரு சிறந்த முறையில் எழுதப்பட்ட வாக்கியத்தின் "கைரேகை", AI மூலம் உருவாக்கப்பட்ட வாக்கியத்தைப் போலவே தோற்றமளிக்கலாம். இது ஒரு ஆபத்தான சூழலை உருவாக்குகிறது; பல தசாப்தங்களாகத் தங்கள் திறமையை வளர்த்தெடுத்த ஒரு எழுத்தாளர், Sidekicker போன்ற கருவியின் தவறான நேர்மறை (false positive) முடிவுகளால் தனது ஒப்பந்தங்களை இழக்க நேரிடலாம் அல்லது தனது நற்பெயருக்குக் களங்கம் விளைவிக்கலாம்.

"Black Box" சிக்கலும் கண்டறிதலின் எதிர்காலமும்

வெற்றி பெற்ற கருவிகள் கூட வெளிப்படைத்தன்மை குறித்து விமர்சனங்களை எதிர்கொள்கின்றன. தனது கண்டறியும் கருவி அடிப்படையில் ஒரு "black box" போலச் செயல்படுகிறது என்றும், அதாவது ஒரு குறிப்பிட்ட உரை ஏன் அடையாளப்படுத்தப்பட்டது என்பதற்கான விரிவான விளக்கத்தை வழங்க முடியாது என்றும் Pangram CEO Max Spero குறிப்பிட்டார். மனிதர்கள் ஒரு LLM-ன் சீரான தன்மையை விட அதிக மாறுபாடுகளுடனும் வாதக் கட்டமைப்புகளுடனும் எழுதுகிறார்கள் என்று அவர் வாதிட்டாலும், விளக்கமளிக்கும் திறன் இல்லாமை பொறுப்புக்கூறலுக்கு ஒரு தடையாகவே உள்ளது.

மேலும், இந்தச் சோதனையில் Pangram மற்றும் Grammarly ஆகியவற்றின் வெற்றி, அவை முதன்மையாக தவறான நேர்மறைகளைத் தவிர்ப்பதில் (மனிதர்களைத் தவறாக அடையாளப்படுத்தாமல் இருப்பதில்) சிறந்தவை என்பதை மட்டுமே நிரூபிக்கிறது. அவை AI-யைக் கண்டறிவதில் (இயந்திர உரையை அடையாளம் காண்பதில்) சமமான செயல்திறன் கொண்டவை என்று இது கட்டாயமாக உறுதிப்படுத்தாது.

"எழுத AI-யைப் பயன்படுத்துவதற்கும்" மற்றும் "சிந்திக்க AI-யைப் பயன்படுத்துவதற்கும்" இடையிலான வேறுபாட்டைத் தொழில்துறை கண்டறியப் போராடிக்கொண்டிருக்கும் நிலையில், கண்டறியும் கருவிகள் ஒருபோதும் தொழில்முறை முடிவுகளுக்கான ஒரே அடிப்படையாக இருக்கக்கூடாது என்று Authors Guild எச்சரிக்கிறது.

முக்கியக் குறிப்புகள்

துல்லியத்தில் அதீத வேறுபாடு: இந்தச் சோதனையில் Pangram மற்றும் Grammarly ஆகியவை 0% தவறான நேர்மறை விகிதத்தைப் பெற்றன, ஆனால் Sidekicker.ai மனித உரையில் 100% ஐயும் AI மூலம் உருவாக்கப்பட்டதாகக் குறிப்பிட்டது.
தொழில்முறைத் தண்டனை: உயர்தரமான, துல்லியமான மனித எழுத்து, AI வெளியீடுகளுடன் புள்ளிவிவர ரீதியாகப் ஒற்றுமைகளைக் கொண்டுள்ளது, இது நிபுணத்துவ எழுத்தாளர்களைக் கண்டறிதலில் ஏற்படும் பிழைகளுக்கு உள்ளாக்குகிறது.
மனித மேற்பார்வைக்கான அழைப்பு: கண்டறியும் கருவிகளைத் துணைக்கருவிகளாக மட்டுமே பயன்படுத்தவும் மற்றும் எழுத்தாளர்களுக்குத் தங்கள் படைப்புகளைத் தற்காத்துக் கொள்ள வாய்ப்பளிக்க வேண்டும் என்றும் பதிப்பகங்களுக்கு Authors Guild அறிவுறுத்துகிறது.

AI கண்டறிதலின் நம்பகத்தன்மை நெருக்கடி: சில கருவிகள் வெற்றி பெறுகின்றன, மற்றவை முற்றிலும் தோல்வியடைகின்றன

AI கண்டறிதலின் நம்பகத்தன்மை நெருக்கடி: சில கருவிகள் வெற்றி பெறுகின்றன, மற்றவை முற்றிலும் தோல்வியடைகின்றன

செயல்திறன் இடைவெளி: முழுமையான துல்லியம் முதல் முழுமையான தோல்வி வரை

தொழில்முறை எழுத்தின் முரண்

"Black Box" சிக்கலும் கண்டறிதலின் எதிர்காலமும்

முக்கியக் குறிப்புகள்

Continue reading

ஒரு கையால் எழுதப்பட்ட ஆய்வறிக்கை 99 சதவீத AI ஆக மாறும்போது

AI நம்பிக்கை இடைவெளி: ஏன் 60% அமெரிக்க நுகர்வோர் AI செய்திகளை நிராகரிக்கிறார்கள்?

𝗔𝗜 𝗗𝗲𝘁𝗲𝗰𝘁𝗼𝗿𝘀 𝗔𝗿𝗲 𝗚𝘂𝗲𝘀𝘀𝗶𝗻𝗴

விவாதங்களில் மனிதர்களின் பன்முகத்தன்மையை பிரதிபலிப்பதில் LLM-கள் ஏன் சிரமப்படுகின்றன?