OpenAI Launches GPT 5.6 Sol to Challenge Claude Mythos

Translated for your language. Read the original.

AI-assisted draft.

GyaanSetu Editorialகடந்த வாரம்3min read

OpenAI Launches GPT 5.6 Sol to Challenge Claude Mythos

In this article

Claude Mythos-க்கு சவால் விடும் வகையில் OpenAI தனது GPT-5.6 Sol-ஐ அறிமுகப்படுத்துகிறது

ஏஜென்டிக் கோடிங் (agentic coding) மற்றும் சைபர் பாதுகாப்பு (cybersecurity) துறைகளில் ஆதிக்கம் செலுத்தும் வகையில் வடிவமைக்கப்பட்ட ஒரு அதிநவீன புதிய மாடல் தலைமுறையான GPT-5.6 Sol-ஐ OpenAI அதிகாரப்பூர்வமாக வெளியிட்டுள்ளது. இந்த வெளியீடு பகுத்தறியும் திறனில் (reasoning capabilities) ஒரு குறிப்பிடத்தக்க முன்னேற்றத்தைக் குறித்தாலும், அமெரிக்க அரசாங்கத்தின் கட்டுப்பாட்டு அணுகல் நெறிமுறைகள் (access protocols) குறித்த சர்ச்சைகளுக்கு மத்தியில் இது வந்துள்ளது.

செயல்திறன் மற்றும் அளவிற்கான புதிய அடுக்கு கட்டமைப்பு (Tiered Architecture)

ஒற்றை மாடல் வெளியீடுகளிலிருந்து விலகி, பல்வேறு நிறுவனத் தேவைகளுக்காக வடிவமைக்கப்பட்ட ஒரு அடுக்கு பெயரிடும் முறையை OpenAI அறிமுகப்படுத்தியுள்ளது. இந்த கட்டமைப்பு "Sol", "Terra" மற்றும் "Luna" ஆகியவற்றை நிரந்தர செயல்திறன் அடுக்குகளாகப் பயன்படுத்துகிறது, இது டெவலப்பர்கள் தங்கள் பட்ஜெட் மற்றும் சிக்கலான தன்மைக்கு ஏற்ப மாடல்களைப் பயன்படுத்த அனுமதிக்கிறது.

இந்த வரிசைமுறையின் உச்சியில் முதன்மை மாடலான Sol உள்ளது. அதற்கு கீழே Terra உள்ளது, இது GPT-5.5-ன் செயல்திறனைப் பாதி விலையில் வழங்குகிறது; மேலும் பட்ஜெட் சார்ந்த மட்டமாக Luna உள்ளது. அதிகப்படியான வேலைப்பளுவிற்கு (high-intensity workloads), ஆழமான பகுத்தறிதலுக்காக "max" மோடு மற்றும் பலதரப்பட்ட சிக்கலான பணிகளைக் கையாள இணையாகச் செயல்படும் துணை ஏஜென்ட்களைப் (sub-agents) பயன்படுத்தும் "ultra" மோடு ஆகியவற்றை OpenAI அறிமுகப்படுத்தியுள்ளது.

கோடிங் மற்றும் உயிரியலில் புதிய மைல்கற்களை எட்டுகிறது

Anthropic நிறுவனத்தின் Claude Mythos வகுப்பை முந்துவதே GPT-5.6 Sol-ன் முதன்மை நோக்கமாகும். ஏஜென்டிக் கோடிங் பணிகளில், OpenAI-ன் கூற்றுகளை புள்ளிவிவரங்கள் உறுதிப்படுத்துகின்றன: Terminal-Bench 2.1 பெஞ்ச்மார்க்கில், Sol Ultra 91.9% என்ற வியக்கத்தக்க சாதனையைப் படைத்துள்ளது, இது Claude Mythos 5 (88.0%) மற்றும் Google-ன் Gemini 3.1 Pro Preview (70.7%) ஆகியவற்றை விட அதிகமாகும்.

இந்த மாடல் சிறப்பு அறிவியல் துறைகளிலும் குறிப்பிடத்தக்க முன்னேற்றங்களைக் காட்டுகிறது. GeneBench v1 genomics பெஞ்ச்மார்க்கில், Sol 30% மதிப்பெண்களைப் பெற்றுள்ளது, இது GPT-5.5 எட்டிய 22%-ஐ விட கணிசமான வளர்ச்சியாகும்; முக்கியமாக இது குறைவான டோக்கன்களையே (tokens) பயன்படுத்தியுள்ளது. இந்தத் திறன், OpenAI வெறும் "பெரிய" கணக்கீடுகளை விட (larger compute) "புத்திசாலித்தனமான" கணக்கீடுகளில் (smarter compute) கவனம் செலுத்துவதை உணர்த்துகிறது.

சைபர் பாதுகாப்பு: பாதுகாப்பாளர் vs தாக்குபவர்

சைபர் பாதுகாப்புத் துறையில், Sol ஒரு முதன்மையான பாதுகாப்பு கருவியாக (defensive tool) செயல்பட இலக்கு வைத்துள்ளது. Google V8 JavaScript என்ஜினில் உள்ள பாதிப்புகளைக் கண்டறிந்து பயன்படுத்துவதற்கான திறனைச் சோதிக்கும் ExploitBench-இல், Sol ஆனது Anthropic-ன் Mythos Preview-ன் செயல்திறனுக்கு இணையாகச் செயல்படுகிறது, ஆனால் ஒரு முக்கியமான சாதகத்துடன்: இது மூன்றில் ஒரு பங்கு வெளியீட்டு டோக்கன்களை மட்டுமே பயன்படுத்துகிறது.

OpenAI, Sol-ஐ ஒரு தன்னாட்சித் தாக்குபவராக (autonomous attacker) இல்லாமல், ஒரு பாதுகாப்பாளராகவே முன்னிறுத்துகிறது. Chromium மற்றும் Firefox தொடர்பான சோதனைகளில், இந்த மாடல் பிழைகளையும் (bugs) சுரண்டல் ஆரம்பக் கூறுகளையும் (exploitation primitives) வெற்றிகரமாகக் கண்டறிந்தது, ஆனால் ஒரு தன்னாட்சி, முழுமையான தாக்குதல் முறையை (full-chain exploit) உருவாக்குவதைத் தவிர்த்தது. Sol தனது உள்நிலைத் தயார்நிலை கட்டமைப்பிற்குள் (Preparedness Framework) "Cyber Critical" வரம்பிற்கு கீழே இருப்பதாக OpenAI கூறுகிறது.

அரசாங்கத்தால் கட்டுப்படுத்தப்படும் அணுகல் குறித்த சர்ச்சை

GPT-5.6 Sol-ன் அறிமுகம் எந்தத் தடங்கலும் இன்றி நடைபெறவில்லை. தற்போது, அமெரிக்க அரசாங்கத்தின் உத்தரவின்படி, API மற்றும் Codex மூலம் ஒரு சில தேர்ந்தெடுக்கப்பட்ட கூட்டாளர்களுக்கு மட்டுமே இதன் அணுகல் உள்ளது. Anthropic நிறுவனத்தின் Fable 5-ஐ சந்தையிலிருந்து நீக்க அரசாங்கம் எடுத்த முந்தைய முடிவைத் தொடர்ந்து இது நிகழ்ந்துள்ளது.

இந்தத் தடைகளுக்கு OpenAI கடும் எதிர்ப்பு தெரிவித்துள்ளதுடன், தற்போதைய அரசாங்க அணுகல் முறையை "நிலையானது அல்ல" (unsustainable) என்று விமர்சித்துள்ளது. இத்தகைய கட்டுப்பாடுகள், உலகளாவிய டிஜிட்டல் கட்டமைப்பைப் பாதுகாப்பதற்குத் தேவையான கருவிகளை டெவலப்பர்கள், நிறுவனங்கள் மற்றும் சைபர் பாதுகாப்பாளர்கள் அணுகுவதைத் தடுப்பதாக நிறுவனம் வாதிடுகிறது.

முக்கியக் குறிப்புகள்

அடுக்கு மாடல் உத்தி (Tiered Model Strategy): OpenAI ஒரு புதிய வரிசைமுறையை அறிமுகப்படுத்துகிறது—Sol (முதன்மை), Terra (நடுத்தர அடுக்கு), மற்றும் Luna (பட்ஜெட்)—மற்றும் இணையாகச் செயல்படும் துணை ஏஜென்ட் பணிகளுக்காக "Ultra" மோடு உள்ளது.
பெஞ்ச்மார்க் ஆதிக்கம்: GPT-5.6 Sol Ultra, Terminal-Bench 2.1-இல் 91.9% பெற்று ஏஜென்டிக் கோடிங் துறையில் முன்னிலை வகிக்கிறது, இது Claude Mythos மற்றும் Gemini ஆகியவற்றை விடத் தெளிவான முன்னேற்றமாகும்.
திறன் சார்ந்த அணுகுமுறை (Efficiency-First Approach): Sol மிகக் குறைவான டோக்கன்களைப் பயன்படுத்திப் போட்டித்தன்மை வாய்ந்த சைபர் பாதுகாப்பு மற்றும் மரபணுவியல் (genomics) முடிவுகளைப் பெறுகிறது, இது டெவலப்பர்களுக்கான ஒரு பணியின் உண்மையான செலவைக் குறைக்க வாய்ப்புள்ளது.

OpenAI Launches GPT 5.6 Sol to Challenge Claude Mythos

Claude Mythos-க்கு சவால் விடும் வகையில் OpenAI தனது GPT-5.6 Sol-ஐ அறிமுகப்படுத்துகிறது

செயல்திறன் மற்றும் அளவிற்கான புதிய அடுக்கு கட்டமைப்பு (Tiered Architecture)

கோடிங் மற்றும் உயிரியலில் புதிய மைல்கற்களை எட்டுகிறது

சைபர் பாதுகாப்பு: பாதுகாப்பாளர் vs தாக்குபவர்

அரசாங்கத்தால் கட்டுப்படுத்தப்படும் அணுகல் குறித்த சர்ச்சை

முக்கியக் குறிப்புகள்

Continue reading

OpenAI Launches GPT 5.6 Suite Amidst US Regulatory Scrutiny

அமெரிக்க அரசாங்கத்தின் கோரிக்கையைத் தொடர்ந்து GPT 5.6 வெளியீட்டை OpenAI கட்டுப்படுத்துகிறது

மென்பொருள் பெஞ்ச்மார்க்குகளில் OpenAI-ன் GPT 5.6 Sol முறைகேடு செய்ததாகக் கண்டறியப்பட்டது

GTP 5.6 Sol: OpenAI's Access Wall Explained

GPT 5.6 என்பது ஒரு மாடல் வெளியீடு. உண்மையான விஷயம் அதன் அணுகல் பட்டியல் (Access List) தான்.