மார்கரெட் அட்வூட் எச்சரிக்கை: AI ஏன் இன்னும் "Garbage In, Garbage Out" என்ற நிலையிலேயே சிக்கியுள்ளது?
புகழ்பெற்ற எழுத்தாளர் மார்கரெட் அட்வூட் (Margaret Atwood), சமீபத்தில் பெரிய மொழி மாதிரிகள் (large language models) குறித்த தனது கடுமையான விமர்சனத்தைப் பகிர்ந்து கொண்டார். துல்லியம் மற்றும் தரவு ஒருமைப்பாடு (data integrity) ஆகியவற்றில் நிலவும் தொடர்ச்சியான போராட்டத்தை அவர் சுட்டிக்காட்டினார். அவரது அனுபவம் தற்போதைய AI யுகத்தின் ஒரு அடிப்படை உண்மையை அடிக்கோடிட்டுக் காட்டுகிறது: மிகவும் மேம்பட்ட மாதிரிகள் கூட அவற்றின் பயிற்சித் தரவின் (training data) தரத்தால் மட்டுப்படுத்தப்படுகின்றன.
Claude சோதனை: மாயத்தோற்றங்கள் (Hallucinations) குறித்த ஒரு பாடம்
போர்ச்சுகலில் உள்ள போர்டோவில் நடைபெற்ற Babell இலக்கிய மற்றும் கலாச்சார விழாவில் பேசிய Handmaid’s Tale ஆசிரியர், Anthropic நிறுவனத்தின் Claude-ஐப் பயன்படுத்திய தனது ஒரு அனுபவத்தை வெளிப்படுத்தினார். பிரிட்டிஷ் துப்பறியும் தொடரான Father Brown பற்றிய தகவல்களைப் பெற அந்த சாட்போட்டை (chatbot) பயன்படுத்திய அட்வூட்டின் முயற்சி தோல்வியில் முடிந்தது. இது "hallucination" (மாயத்தோற்றம்) என்ற கருத்தை மிகச்சரியாக விளக்குகிறது.
அட்வூட்டின் கூற்றுப்படி, அந்த மாதிரி தவறான தகவல்களை வழங்கியது, அதாவது பயனரிடம் "பொய்" கூறியது. அந்த LLM அநேகமாக ஏராளமான தொலைக்காட்சி விமர்சனங்களை மேலோட்டமாகப் பார்த்துத் தேர்ந்தெடுத்திருக்கும், ஆனால் இணைய விமர்சனங்கள் பொதுவாக கதையின் முக்கியத் திருப்பங்களை (spoilers) வெளிப்படுத்தாமல் தவிர்ப்பதால், அதன் பயிற்சித் தொகுப்பில் உள்ள வடிவங்களால் (patterns) அந்த மாதிரி தவறாக வழிநடத்தப்பட்டது என்று அவர் குறிப்பிட்டார். இந்தத் தொழில்நுட்ப நுணுக்கம் டெவலப்பர்களுக்கான ஒரு முக்கிய சவாலைச் சுட்டிக்காட்டுகிறது: LLM-கள் என்பது உண்மைத் தன்மையைச் சரிபார்ப்பதை விட, வடிவங்களை ஒப்பிடுவதற்கு (pattern matching) முன்னுரிமை அளிக்கும் நிகழ்தகவு இயந்திரங்கள் (probabilistic engines) ஆகும், இது பெரும்பாலும் நம்பிக்கையான ஆனால் தவறான வெளியீடுகளுக்கு வழிவகுக்கிறது.
தரவுத் தயக்கம்: Garbage In, Garbage Out
அட்வூட்டின் விமர்சனம் ஒரு காலத்தால் அழியாத கணினித் தத்துவத்தை மையமாகக் கொண்டுள்ளது: "garbage in, garbage out" (தவறான உள்ளீடு, தவறான வெளியீடு). LLM-கள் இணையத்திலிருந்து சேகரிக்கப்பட்ட, ஏற்கனவே வெளியிடப்பட்ட மற்றும் காலாவதியான தகவல்களின் அடிப்படையில் பயிற்சியளிக்கப்படுகின்றன என்று அவர் சுட்டிக்காட்டினார். ஒரு மாதிரிக்கு முழுமையற்ற, சார்புடைய அல்லது தர்க்கரீதியாக முரண்பட்ட தரவுகள் வழங்கப்பட்டால், அதன் வெளியீடு தவிர்க்க முடியாமல் அந்தப் பிழைகளைப் பிரதிபலிக்கும்.
பரந்த AI சூழலில், மாடல் அளவுருக்களை (model parameters) அதிகரிப்பது தரத்தின் தரத்திற்கு மாற்றாகாது என்பதை இது நினைவூட்டுகிறது. பகுத்தறியும் திறனை (reasoning capabilities) மேம்படுத்த டெவலப்பர்கள் பெரிய தரவுத் தொகுப்புகளை நோக்கித் தள்ளும்போது, அட்வூட் குறிப்பிட்டது போல விமர்சனங்களில் கதையின் சுருக்கங்கள் இல்லாதது போன்ற தரவுத் தொகுப்பிற்குள் இருக்கும் "இரைச்சல்" (noise), Claude போன்ற அதிநவீன கட்டமைப்புகளாலும் எளிதில் சரிசெய்ய முடியாத முறையான பிழைகளை (systematic errors) உருவாக்கக்கூடும்.
நெறிமுறை கவலை: சந்தர்ப்பவாதம் vs படைப்பாற்றல்
தொழில்நுட்ப வரம்புகளுக்கு அப்பால், AI பயன்பாட்டில் உள்ள மனிதக் கூறுகளைப் பற்றியும் அட்வூட் பேசினார். உண்மையான படைப்பு அல்லது ஆராய்ச்சியின் கடின உழைப்பைத் தவிர்க்க எளிதான வழியைத் தேடும் "சந்தர்ப்பவாதிகள்" என்று AI-ஐ அதிகம் நம்பியிருப்பவர்களை அவர் அழைத்தார். கண்டறிய முடியாத AI-ஆல் உருவாக்கப்பட்ட உள்ளடக்கத்தைப் பயன்படுத்தி "ஏமாற்றுவதற்கு" இருக்கும் தூண்டுதல், மனித அறிவு மற்றும் நுணுக்கங்களைச் சார்ந்திருக்கும் தொழில்துறைகளுக்கு வளர்ந்து வரும் கவலையாக உள்ளது என்று அவர் எச்சரித்தார்.
நிறுவனர்கள் மற்றும் தொழில்நுட்ப வல்லுநர்களுக்கு இந்த வேறுபாடு மிக முக்கியமானது. AI ஒரு சக்திவாய்ந்த உற்பத்தித் கருவியாகச் செயல்பட முடியும் என்றாலும், "வணிகக் காரணங்களுக்காகப் பயன்படுத்துபவர்கள் கூட அதைச் சரிபார்க்க வேண்டும்" என்ற அட்வூட்டின் அவதானிப்பு, AI பணிப்பாய்வில் (workflow) மனித மேற்பார்வை ஒரு தவிர்க்க முடியாத அங்கமாகத் தொடர்கிறது என்பதை வலியுறுத்துகிறது. முழுமையான தன்னாட்சி கொண்ட, பிழையற்ற AI காலம் இன்னும் ஒரு தொலைதூரக் கனவே ஆகும், மேலும் உண்மையின் பொறுப்பு பயனரிடமே உள்ளது.
முக்கியக் கருத்துக்கள்
- தரவு ஒருமைப்பாடு மிக முக்கியமானது: LLM-களுக்கு "garbage in, garbage out" என்ற தத்துவமே மிகப்பெரிய தடையாகும், ஏனெனில் மாதிரிகள் அவற்றின் பயிற்சித் தரவின் தரம் மற்றும் முழுமையால் மட்டுப்படுத்தப்படுகின்றன.
- மாயத்தோற்றப் பொறி (The Hallucination Trap): Anthropic நிறுவனத்தின் Claude போன்ற மேம்பட்ட மாதிரிகள் கூட, அவற்றின் பயிற்சித் தரவில் உள்ள அடிப்படை வடிவங்கள் தவறாக இருந்தால், எளிய உண்மைத் தகவல்களைத் தருவதில் தோல்வியடையக்கூடும்.
- மனித மேற்பார்வையின் அவசியம்: AI-ஐ மனித நிபுணத்துவம் மற்றும் விமர்சன சிந்தனைக்கு மாற்றாகப் பார்க்காமல், தொடர்ச்சியான சரிபார்ப்பு தேவைப்படும் ஒரு கருவியாகவே பார்க்க வேண்டும்.
