AI கூட்டுமனதை உடைத்தல்: Flint எவ்வாறு LLM குழுச் சிந்தனையை (Groupthink) எதிர்த்துப் போராடுகிறது
ChatGPT மற்றும் Claude போன்ற பெரிய மொழி மாதிரிகள் (LLMs) கோடிங் மற்றும் ஆராய்ச்சியில் சிறந்து விளங்கினாலும், அவை கணிக்கக்கூடிய "குழுச் சிந்தனை" (groupthink) என்ற வலையில் சிக்கிக்கொண்டே வருகின்றன. முக்கிய நீரோட்ட மாதிரிகள் அதிக நிகழ்தகவு கொண்ட, மீண்டும் மீண்டும் வரும் பதில்களை நோக்கி நகரும் நிலையில், ஒரு புதிய ஸ்டார்ட்அப், உருவாக்கும் AI (generative AI) சூழலில் மிகவும் தேவையான மாறுபட்ட கருத்துக்களை (divergence) புகுத்த முயற்சி செய்து வருகிறது.
பிரச்சனை: "செயற்கை கூட்டுமனம்" (Artificial Hivemind) விளைவு
தற்போதைய LLM வளர்ச்சியில் உள்ள ஒரு முக்கிய குறைபாடு என்னவென்றால், மாதிரிகள் புள்ளிவிவர ரீதியாக மிகவும் சாத்தியமான பதில்களை நோக்கி ஈர்க்கப்படுவதுதான். இது ஆராய்ச்சியாளர்கள் "செயற்கை கூட்டுமனம்" (Artificial Hivemind) என்று அழைக்கும் ஒரு நிகழ்வுக்கு வழிவகுக்கிறது. NeurIPS விருது பெற்ற ஆய்வறிக்கையான, “Artificial Hivemind: The Open-Ended Homogeneity of Language Models (and Beyond),” இந்த ஆழமான மறுசுழற்சியை வெளிப்படுத்தியது.
ஆராய்ச்சி குழு அமெரிக்காவின் முக்கிய மாதிரிகள் மற்றும் சீனாவின் ஓப்பன் சோர்ஸ் பதிப்புகள் உட்பட 25 வெவ்வேறு LLM-களைச் சோதித்தது. "காலம்" (time) என்பதற்கு ஒரு உருவகத்தைக் கேட்கும்போது, 1,250 பதில்களில் பெரும்பான்மையானவை "காலம் ஒரு நதி" அல்லது "காலம் ஒரு நெசவாளி" போன்ற வழக்கமான (clichés) பதில்களாகவே இருந்தன. இந்தத் தனித்துவமின்மை என்பது வெறும் விசித்திரம் மட்டுமல்ல; நம்பகத்தன்மை மற்றும் ஒருமைப்பாட்டை (coherence) அதிகப்படுத்துவதே முதன்மை நோக்கமாகக் கொண்டு, ஒரே மாதிரியான தரவுத்தொகுப்புகளில் (datasets) மாதிரிகளைப் பயிற்றுவிப்பதன் விளைவாகும். புதுமையைத் தேடுவது சில நேரங்களில் பலவீனமான மற்றும் குறைவான நம்பகத்தன்மை கொண்ட பதில்களுக்கு வழிவகுக்கும் என்பதை OpenAI ஒப்புக்கொண்டுள்ளது, அதனால்தான் பெரும்பாலான மாதிரிகள் பாதுகாப்பான, "அதிக நிகழ்தகவு" கொண்ட வெளியீடுகளையே வழங்குகின்றன.
Flint-ன் வருகை: கணிக்கக்கூடிய தன்மைக்கு பதிலாக பன்முகத்தன்மைக்கு முன்னுரிமை
ஆஸ்திரேலிய ஸ்டார்ட்அப் Springboards தனது புதிய மாதிரியான Flint மூலம் இந்த நிலையை மாற்ற முயல்கிறது. எந்தவொரு விலையிலும் மாயத்தோற்றங்களைத் (hallucinations) தவிர்க்க முயலும் முக்கிய நீரோட்ட மாதிரிகளைப் போலல்லாமல், படைப்பாற்றல் சார்ந்த பணிகளுக்கு ஒரு குறிப்பிட்ட அளவு கணிக்க முடியாத மாறுபட்ட கருத்துக்கள் அவசியம் என்று Springboards CEO Pip Bingemann வாதிடுகிறார்.
நடைமுறைச் சோதனையில், வெளியீட்டு விநியோகத்தில் உள்ள வேறுபாடு தெளிவாகத் தெரிகிறது:
- தற்செயல் தன்மை (Randomness): ஒரு தற்செயலான எண்ணைக் கேட்கும்போது, ChatGPT மற்றும் Claude அடிக்கடி "7" என்ற எண்ணையே வழங்கின; ஆனால் Flint "3.7916" போன்ற துல்லியமான, வழக்கத்திற்கு மாறான எண்களை வழங்கியது.
- படைப்பாற்றல் மிக்க பிராண்டிங் (Creative Branding): New Balance நிறுவனத்திற்கான வாசகத்தைக் (tagline) கேட்டபோது, Claude மற்றும் ChatGPT ஆகிய இரண்டும் "Run your way" என்று வழங்கின, ஆனால் Flint "Built to last, run to win" என்ற தனித்துவமான மாற்றாக வழங்கியது.
- பெயர்ச்சொல் தேர்வு (Noun Selection): முக்கிய நீரோட்ட மாதிரிகள் Toyota அல்லது Honda போன்ற "பாதுகாப்பான" பிராண்டுகளைத் தேர்ந்தெடுக்கும் நிலையில், Flint ஒரு Ford F-150 போன்ற கணிக்க முடியாத விருப்பங்களைத் தேர்ந்தெடுப்பதன் மூலம் தனது பரந்தத் தேர்வைக் காட்டுகிறது.
நிபுணர்களுக்கான ஒரு படைப்பாற்றல் கருவி
Springboards ஒரு தனி மாதிரியை மட்டும் உருவாக்கவில்லை; அவர்கள் விளம்பரம் மற்றும் சந்தைப்படுத்தல் (marketing) நிபுணர்களுக்காக ஒரு பிரத்யேகக் கருவியையும் உருவாக்கி வருகின்றனர். இந்தத் தளம் பயனர்கள் ChatGPT மற்றும் Claude உட்பட பல மாதிரிகளிலிருந்து வெளியீடுகளைத் திரட்டி, அவற்றை ஒன்றிணைத்து புதிய யோசனைகளை உருவாக்க அனுமதிக்கிறது. Flint இந்தச் சூழலில் ஒரு "படைப்பாற்றல் ஊக்கி"யாக (creative catapult) செயல்படுகிறது, இது பயனர்களை அவர்களின் தற்போதைய சிந்தனைச் சட்டகங்களிலிருந்து வெளியே தள்ள வடிவமைக்கப்பட்டுள்ளது.
77X நிறுவனத்தின் தலைமை உத்தி அதிகாரி (Chief Strategy Officer) Zoe Scaman கூறுகையில், முக்கிய நீரோட்ட மாதிரிகள் பெரும்பாலும் ஒரே மாதிரியான சலிப்பூட்டும் தீர்வுகளை (உதாரணமாக, "நிதி அறிவை வேடிக்கையான முறையில் கற்பித்தல்") பரிந்துரைக்கின்றன, ஆனால் Flint, செல்வச் சேகரிப்பு என்ற கருத்தாக்கத்தையே முழுமையாக மறுசீரமைக்கும் (rebranding) யோசனைகள் போன்ற முற்றிலும் மாறுபட்ட பார்வைகளை வழங்குகிறது என்று குறிப்பிட்டுள்ளார்.
முக்கியக் குறிப்புகள்
- LLM ஒருமைப்பாடு (Homogeneity): ஒரே மாதிரியான பயிற்சி முறைகளால், முக்கிய மாதிரிகள் ஒரே மாதிரியான, கணிக்கக்கூடிய பதில்களை நோக்கி நகர்கின்றன, இது "செயற்கை கூட்டுமனம்" (Artificial Hivemind) விளைவை உருவாக்குகிறது.
- Flint அணுகுமுறை: Springboards-ன் Flint மாதிரி பதில்களின் பன்முகத்தன்மை மற்றும் மாறுபட்ட கருத்துக்களுக்கு முன்னுரிமை அளிக்கிறது, இது சாதாரண மாதிரிகளை விட புதிய யோசனைகளை உருவாக்குவதற்கும் (brainstorming) படைப்பாற்றல் உத்திகளுக்கும் மிகவும் பொருத்தமானது.
- நம்பகத்தன்மை மற்றும் புதுமை இடையிலான சமநிலை (The Reliability Trade-off): மாதிரியின் நம்பகத்தன்மைக்கும் (அதிக நிகழ்தகவு எல்லைக்குள் இருப்பது) மற்றும் படைப்பாற்றல் மிக்க புதுமைக்கும் (குறைந்த நிகழ்தகவு கொண்ட, மாறுபட்ட வெளியீடுகளை ஏற்றுக்கொள்வது) இடையே உள்ள அடிப்படை மோதலைத் தொழில் துறை எதிர்கொள்கிறது.
