Claude Mythos-க்கு சவால் விடும் வகையில் OpenAI தனது GPT-5.6 Sol-ஐ அறிமுகப்படுத்துகிறது
ஏஜென்டிக் கோடிங் (agentic coding) மற்றும் சைபர் பாதுகாப்பு (cybersecurity) துறைகளில் ஆதிக்கம் செலுத்தும் வகையில் வடிவமைக்கப்பட்ட ஒரு அதிநவீன புதிய மாடல் தலைமுறையான GPT-5.6 Sol-ஐ OpenAI அதிகாரப்பூர்வமாக வெளியிட்டுள்ளது. இந்த வெளியீடு பகுத்தறியும் திறனில் (reasoning capabilities) ஒரு குறிப்பிடத்தக்க முன்னேற்றத்தைக் குறித்தாலும், அமெரிக்க அரசாங்கத்தின் கட்டுப்பாட்டு அணுகல் நெறிமுறைகள் (access protocols) குறித்த சர்ச்சைகளுக்கு மத்தியில் இது வந்துள்ளது.
செயல்திறன் மற்றும் அளவிற்கான புதிய அடுக்கு கட்டமைப்பு (Tiered Architecture)
ஒற்றை மாடல் வெளியீடுகளிலிருந்து விலகி, பல்வேறு நிறுவனத் தேவைகளுக்காக வடிவமைக்கப்பட்ட ஒரு அடுக்கு பெயரிடும் முறையை OpenAI அறிமுகப்படுத்தியுள்ளது. இந்த கட்டமைப்பு "Sol", "Terra" மற்றும் "Luna" ஆகியவற்றை நிரந்தர செயல்திறன் அடுக்குகளாகப் பயன்படுத்துகிறது, இது டெவலப்பர்கள் தங்கள் பட்ஜெட் மற்றும் சிக்கலான தன்மைக்கு ஏற்ப மாடல்களைப் பயன்படுத்த அனுமதிக்கிறது.
இந்த வரிசைமுறையின் உச்சியில் முதன்மை மாடலான Sol உள்ளது. அதற்கு கீழே Terra உள்ளது, இது GPT-5.5-ன் செயல்திறனைப் பாதி விலையில் வழங்குகிறது; மேலும் பட்ஜெட் சார்ந்த மட்டமாக Luna உள்ளது. அதிகப்படியான வேலைப்பளுவிற்கு (high-intensity workloads), ஆழமான பகுத்தறிதலுக்காக "max" மோடு மற்றும் பலதரப்பட்ட சிக்கலான பணிகளைக் கையாள இணையாகச் செயல்படும் துணை ஏஜென்ட்களைப் (sub-agents) பயன்படுத்தும் "ultra" மோடு ஆகியவற்றை OpenAI அறிமுகப்படுத்தியுள்ளது.
கோடிங் மற்றும் உயிரியலில் புதிய மைல்கற்களை எட்டுகிறது
Anthropic நிறுவனத்தின் Claude Mythos வகுப்பை முந்துவதே GPT-5.6 Sol-ன் முதன்மை நோக்கமாகும். ஏஜென்டிக் கோடிங் பணிகளில், OpenAI-ன் கூற்றுகளை புள்ளிவிவரங்கள் உறுதிப்படுத்துகின்றன: Terminal-Bench 2.1 பெஞ்ச்மார்க்கில், Sol Ultra 91.9% என்ற வியக்கத்தக்க சாதனையைப் படைத்துள்ளது, இது Claude Mythos 5 (88.0%) மற்றும் Google-ன் Gemini 3.1 Pro Preview (70.7%) ஆகியவற்றை விட அதிகமாகும்.
இந்த மாடல் சிறப்பு அறிவியல் துறைகளிலும் குறிப்பிடத்தக்க முன்னேற்றங்களைக் காட்டுகிறது. GeneBench v1 genomics பெஞ்ச்மார்க்கில், Sol 30% மதிப்பெண்களைப் பெற்றுள்ளது, இது GPT-5.5 எட்டிய 22%-ஐ விட கணிசமான வளர்ச்சியாகும்; முக்கியமாக இது குறைவான டோக்கன்களையே (tokens) பயன்படுத்தியுள்ளது. இந்தத் திறன், OpenAI வெறும் "பெரிய" கணக்கீடுகளை விட (larger compute) "புத்திசாலித்தனமான" கணக்கீடுகளில் (smarter compute) கவனம் செலுத்துவதை உணர்த்துகிறது.
சைபர் பாதுகாப்பு: பாதுகாப்பாளர் vs தாக்குபவர்
சைபர் பாதுகாப்புத் துறையில், Sol ஒரு முதன்மையான பாதுகாப்பு கருவியாக (defensive tool) செயல்பட இலக்கு வைத்துள்ளது. Google V8 JavaScript என்ஜினில் உள்ள பாதிப்புகளைக் கண்டறிந்து பயன்படுத்துவதற்கான திறனைச் சோதிக்கும் ExploitBench-இல், Sol ஆனது Anthropic-ன் Mythos Preview-ன் செயல்திறனுக்கு இணையாகச் செயல்படுகிறது, ஆனால் ஒரு முக்கியமான சாதகத்துடன்: இது மூன்றில் ஒரு பங்கு வெளியீட்டு டோக்கன்களை மட்டுமே பயன்படுத்துகிறது.
OpenAI, Sol-ஐ ஒரு தன்னாட்சித் தாக்குபவராக (autonomous attacker) இல்லாமல், ஒரு பாதுகாப்பாளராகவே முன்னிறுத்துகிறது. Chromium மற்றும் Firefox தொடர்பான சோதனைகளில், இந்த மாடல் பிழைகளையும் (bugs) சுரண்டல் ஆரம்பக் கூறுகளையும் (exploitation primitives) வெற்றிகரமாகக் கண்டறிந்தது, ஆனால் ஒரு தன்னாட்சி, முழுமையான தாக்குதல் முறையை (full-chain exploit) உருவாக்குவதைத் தவிர்த்தது. Sol தனது உள்நிலைத் தயார்நிலை கட்டமைப்பிற்குள் (Preparedness Framework) "Cyber Critical" வரம்பிற்கு கீழே இருப்பதாக OpenAI கூறுகிறது.
அரசாங்கத்தால் கட்டுப்படுத்தப்படும் அணுகல் குறித்த சர்ச்சை
GPT-5.6 Sol-ன் அறிமுகம் எந்தத் தடங்கலும் இன்றி நடைபெறவில்லை. தற்போது, அமெரிக்க அரசாங்கத்தின் உத்தரவின்படி, API மற்றும் Codex மூலம் ஒரு சில தேர்ந்தெடுக்கப்பட்ட கூட்டாளர்களுக்கு மட்டுமே இதன் அணுகல் உள்ளது. Anthropic நிறுவனத்தின் Fable 5-ஐ சந்தையிலிருந்து நீக்க அரசாங்கம் எடுத்த முந்தைய முடிவைத் தொடர்ந்து இது நிகழ்ந்துள்ளது.
இந்தத் தடைகளுக்கு OpenAI கடும் எதிர்ப்பு தெரிவித்துள்ளதுடன், தற்போதைய அரசாங்க அணுகல் முறையை "நிலையானது அல்ல" (unsustainable) என்று விமர்சித்துள்ளது. இத்தகைய கட்டுப்பாடுகள், உலகளாவிய டிஜிட்டல் கட்டமைப்பைப் பாதுகாப்பதற்குத் தேவையான கருவிகளை டெவலப்பர்கள், நிறுவனங்கள் மற்றும் சைபர் பாதுகாப்பாளர்கள் அணுகுவதைத் தடுப்பதாக நிறுவனம் வாதிடுகிறது.
முக்கியக் குறிப்புகள்
- அடுக்கு மாடல் உத்தி (Tiered Model Strategy): OpenAI ஒரு புதிய வரிசைமுறையை அறிமுகப்படுத்துகிறது—Sol (முதன்மை), Terra (நடுத்தர அடுக்கு), மற்றும் Luna (பட்ஜெட்)—மற்றும் இணையாகச் செயல்படும் துணை ஏஜென்ட் பணிகளுக்காக "Ultra" மோடு உள்ளது.
- பெஞ்ச்மார்க் ஆதிக்கம்: GPT-5.6 Sol Ultra, Terminal-Bench 2.1-இல் 91.9% பெற்று ஏஜென்டிக் கோடிங் துறையில் முன்னிலை வகிக்கிறது, இது Claude Mythos மற்றும் Gemini ஆகியவற்றை விடத் தெளிவான முன்னேற்றமாகும்.
- திறன் சார்ந்த அணுகுமுறை (Efficiency-First Approach): Sol மிகக் குறைவான டோக்கன்களைப் பயன்படுத்திப் போட்டித்தன்மை வாய்ந்த சைபர் பாதுகாப்பு மற்றும் மரபணுவியல் (genomics) முடிவுகளைப் பெறுகிறது, இது டெவலப்பர்களுக்கான ஒரு பணியின் உண்மையான செலவைக் குறைக்க வாய்ப்புள்ளது.
