விவாதங்களில் மனிதப் பன்முகத்தன்மையை நகலெடுக்க LLM-கள் ஏன் சிரமப்படுகின்றன
பெரிய மொழி மாதிரிகள் (LLMs) உள்ளடக்க உருவாக்கத்தில் (content creation) பெருகிவரும் அளவில் ஒருங்கிணைக்கப்பட்டு வரும் நிலையில், ஒரு முக்கியமான கேள்வி எழுகிறது: இயந்திரத்தால் உருவாக்கப்பட்ட உரையையும் மனித எழுத்தையும் நம்மால் உண்மையிலேயே வேறுபடுத்திப் பார்க்க முடியுமா? AI உரை கண்டறியும் ஸ்டார்ட்அப் நிறுவனமான Pangram-ன் CEO Max Spero, இதற்கான பதில் இலக்கணத்தில் இல்லை, மாறாக AI மாதிரிகளுக்குள் இருக்கும் அறிவாற்றல் பன்முகத்தன்மையின் (cognitive diversity) இயல்பான பற்றாக்குறையில் உள்ளது என்று கூறுகிறார்.
AI பகுத்தறிவில் உள்ள "ஒரே மாதிரியான தன்மைப் பிரச்சனை" (Uniformity Problem)
தற்போதைய LLM-களின் மிக முக்கியமான குறைபாடுகளில் ஒன்று, அவற்றின் புள்ளிவிவரக் குவியலை (statistical clustering) நோக்கிய போக்கு ஆகும். ஒரு AI, சரியான இலக்கணம் மற்றும் முறையான தர்க்கத்தின் (formal logic) அடிப்படையில் சராசரி மனிதனை விட சிறப்பாகச் செயல்படலாம், ஆனால் மனித அறிவாற்றலை வரையறுக்கும் "விவாதப் பரப்பளவை" (argumentative breadth) அது கொண்டிருக்கவில்லை. Spero-வின் கருத்துப்படி, நீங்கள் ஒரு தலைப்பைப் பற்றி 100 வெவ்வேறு வாதங்களை ஒரு LLM-இடம் கேட்டால், அதன் வெளியீடுகள் தவிர்க்க முடியாமல் ஒரு குறுகிய, கணிக்கக்கூடிய எல்லைக்குள் குவியும்.
இதற்கு நேர்மாறாக, மனிதச் சிந்தனையின் பரப்பு மிகப்பெரியது மற்றும் ஒழுங்கற்றது. மனிதர்கள் தங்கள் தனித்துவமான வாழ்க்கை அனுபவங்கள், கலாச்சார நுணுக்கங்கள் மற்றும் வழக்கத்திற்கு மாறான தர்க்கங்களைப் பயன்படுத்திப் பார்வைகளை உருவாக்குகிறார்கள். அடுத்த டோக்கனை (token) மிகவும் சாத்தியமானதாகக் கணிக்கப் பயிற்றுவிக்கப்பட்ட LLM-கள், ஒரு பரவலின் "மையத்தை" நோக்கிச் சாய்கின்றன. இது ஒரு தொடர்ச்சியான பகுத்தறிவு முறையை உருவாக்குகிறது, இதன் மூலம் அவற்றின் செயற்கையான தன்மையை மேம்பட்ட வகைப்படுத்திகளால் (classifiers) கண்டறிய முடிகிறது.
Pangram எவ்வாறு இயந்திரப் முறைகளைக் கண்டறிகிறது
நுட்பமான இந்த கட்டமைப்பு அடையாளங்களைக் கண்டறிய Pangram ஒரு டீப்-லேர்னிங் வகைப்படுத்தியைப் (deep-learning classifier) பயன்படுத்துகிறது. சுவாரஸ்யமாக, Spero தனது Pangram தொழில்நுட்பத்தை ஒரு "பிளாக் பாக்ஸ்" (black box) என்று விவரிக்கிறார்; அதாவது, அதன் படைப்பாளிகளால்கூட முழுமையாகப் புரிந்துகொள்ள முடியாத முறைகளை இந்த மாதிரி கண்டறிகிறது. இந்தத் கருவி குறிப்பிட்ட சந்தேகத்திற்குரிய சொற்றொடர்களைத் தடயங்களாகக் காட்டினாலும், ஒரு ஆவணத்தை ஒழுங்கமைக்கும் போது LLM-கள் விட்டுச் செல்லும் அடிப்படையான கட்டமைப்பு வார்ப்புருக்களைக் (structural templates) கண்டறிவதிலேயே இதன் உண்மையான பலம் உள்ளது.
இந்த வார்ப்புருக்கள் நிகழ்தகவின் (probability) டிஜிட்டல் கைரேகைகள் ஆகும். LLM-கள் ஒருமைப்பாடு (coherence) மற்றும் நிலையான கட்டமைப்பிற்காக மேம்படுத்தப்பட்டிருப்பதால், அவை புள்ளிவிவர ரீதியாக ஒரு மனித எழுத்தாளருக்குச் சாத்தியமற்ற ஒழுங்கமைவுப் பாதைகளைப் பின்பற்றுகின்றன; ஏனெனில் ஒரு மனிதன் கருத்துக்களுக்கு இடையே தாவிச் செல்லலாம் அல்லது நேரியல் அல்லாத மாற்றங்களைப் (non-linear transitions) பயன்படுத்தலாம்.
AI கண்டறிதல் மற்றும் உள்ளடக்கத் தூய்மையின் எதிர்காலம்
இந்த வளர்ச்சி AI உலகில் அதிகரித்து வரும் ஒரு ஆயுதப் போட்டியை (arms race) எடுத்துக்காட்டுகிறது. உருவாக்கும் மாதிரிகள் (generative models) மிகவும் நுணுக்கமானதாக உருவாகும்போது, எளிய வடிவப் பொருத்தம் (pattern matching) போதுமானதாக இருக்காது. Pangram போன்ற மேம்பட்ட கண்டறியும் கருவிகளை உண்மையிலேயே "ஏமாற்ற", டெவலப்பர்கள் நிகழ்தகவு அடிப்படையிலான உரை உருவாக்கத்திலிருந்து விலகி, உண்மையான விவாதப் பன்முகத்தன்மை கொண்ட மாதிரிகளை நோக்கி நகர வேண்டும்.
உருவாக்கும் துறையில் (generative space) பணியாற்றும் நிறுவனர்கள் மற்றும் டெவலப்பர்களுக்கு இது ஒரு தொழில்நுட்ப எச்சரிக்கையாகும்: "மனித அளவிலான" AI-க்கான பாதை வெறும் சிறந்த இலக்கணத்தை மட்டும் கொண்டிருக்கக் கூடாது; மாறாக, கணிக்கக்கூடிய சராசரி நிலையிலிருந்து விலகி, மனிதச் சிந்தனையின் குழப்பமான பன்முகத்தன்மையை ஏற்றுக்கொள்ளும் திறனை அது கொண்டிருக்க வேண்டும்.
முக்கியக் குறிப்புகள்
- புள்ளிவிவரக் குவியல் (Statistical Clustering): LLM-கள் ஒரு குறுகிய எல்லைக்குள் வாதங்களை உருவாக்க முனைகின்றன, ஆனால் மனிதப் பகுத்தறிவு அதிக பன்முகத்தன்மை மற்றும் கணிக்க முடியாத தன்மையைக் கொண்டது.
- கட்டமைப்பு கைரேகைகள் (Structural Fingerprints): Pangram போன்ற AI உரை கண்டறியும் கருவிகள், நிகழ்தகவு மாதிரிகளால் விட்டுச் செல்லப்படும் ஆழமான கட்டமைப்பு முறைகள் மற்றும் ஒழுங்கமைவு வார்ப்புருக்களைக் கண்டறிவதன் மூலம் இயந்திரத்தால் உருவாக்கப்பட்ட உள்ளடக்கத்தைக் கண்டறிகின்றன.
- தர்க்க இடைவெளி (The Logic Gap): LLM-கள் முறையான தர்க்கம் மற்றும் இலக்கணத்தில் சிறந்து விளங்கினாலும், அவற்றின் அறிவாற்றல் மாறுபாட்டின்மை (cognitive variance), அவற்றின் இயல்பான ஒரே மாதிரியான தன்மையின் மூலம் கண்டறியப்படக் காரணமாகிறது.
