OpenAI تطلق GPT-5.6 Sol لتحدي Claude Mythos

كشفت OpenAI رسمياً عن GPT-5.6 Sol، وهو جيل جديد ومتطور من النماذج المصممة للهيمنة على قطاعات البرمجة الوكيلية (agentic coding) والأمن السيبراني. وبينما يمثل هذا الإصدار قفزة نوعية في قدرات الاستنتاج، فإنه يأتي وسط جدل متصاعد بشأن بروتوكولات الوصول المقيدة التي تفرضها الحكومة الأمريكية.

بنية طبقية جديدة للأداء والنطاق

وبعيداً عن إصدار النماذج الفردية، قدمت OpenAI نظام تسمية متعدد الطبقات مصمماً لتلبية احتياجات الشركات المتنوعة. وتستخدم هذه البنية "Sol" و"Terra" و"Luna" كفئات أداء دائمة، مما يسمح للمطورين بالتوسع وفقاً للميزانية والتعقيد.

وفي قمة الهرم يأتي Sol، النموذج الرائد. وتحته يأتي Terra، الذي يضاهي أداء GPT-5.5 بنصف التكلفة تقريباً، ثم Luna، الفئة الاقتصادية. ولأعباء العمل عالية الكثافة، قدمت OpenAI وضع "max" للاستنتاج العميق ووضع "ultra" الذي يستخدم وكلاء فرعيين (sub-agents) يعملون بالتوازي لمعالجة المهام المعقدة والمتعددة الأوجه.

وضع معايير جديدة في البرمجة وعلم الأحياء

الهدف الأساسي من GPT-5.6 Sol هو التفوق على فئة Claude Mythos من شركة Anthropic. وفي مهام البرمجة الوكيلية، تدعم الأرقام ادعاءات OpenAI: ففي اختبار Terminal-Bench 2.1، حقق Sol Ultra نسبة مذهلة بلغت 91.9%، متفوقاً على Claude Mythos 5 (88.0%) وGoogle Gemini 3.1 Pro Preview (70.7%).

كما أظهر النموذج طفرات كبيرة في العلوم المتخصصة. ففي اختبار GeneBench v1 لعلم الجينوم، سجل Sol نسبة 30%، وهي زيادة كبيرة عن نسبة 22% التي حققها GPT-5.5، والمثير للاهتمام أن ذلك تم مع استهلاك عدد أقل من الـ tokens. وتشير هذه الكفاءة إلى أن OpenAI تركز على الحوسبة "الأذكى" بدلاً من مجرد الحوسبة "الأكبر".

الأمن السيبراني: المدافع مقابل المهاجم

في مجال الأمن السيبراني، يهدف Sol إلى أن يكون أداة دفاعية رائدة. وفي اختبار ExploitBench — الذي يختبر القدرة على اكتشاف واستغلال الثغرات في محرك Google V8 JavaScript — يضاهي Sol أداء Mythos Preview من Anthropic ولكن مع ميزة حاسمة: فهو يستخدم حوالي ثلث عدد الـ output tokens.

تضع OpenAI نموذج Sol في موقع المدافع بدلاً من المهاجم المستقل. ففي الاختبارات التي شملت Chromium وFirefox، نجح النموذج في تحديد الأخطاء البرمجية (bugs) وأساسيات الاستغلال (exploitation primitives)، لكنه توقف قبل إنتاج استغلال كامل السلسلة (full-chain exploit) وبشكل مستقل. وتؤكد OpenAI أن Sol يظل تحت عتبة "Cyber Critical" ضمن إطار الاستعداد (Preparedness Framework) الداخلي الخاص بها.

جدل حول الوصول الخاضع لسيطرة الحكومة

لا يخلو إطلاق GPT-5.6 Sol من الاحتكاك. ففي الوقت الحالي، يقتصر الوصول على حفنة من الشركاء المختارين عبر API وCodex، وهو قيد تفرضه الحكومة الأمريكية. ويأتي هذا في أعقاب قرار الحكومة السابق بإزالة Fable 5 من شركة Anthropic من السوق.

وقد أعربت OpenAI عن معارضتها الشديدة لهذه القيود، واصفة عملية الوصول الحكومية الحالية بأنها "غير مستدامة". وتجادل الشركة بأن مثل هذه القيود تمنع المطورين والشركات والمدافعين السيبرانيين من الوصول إلى الأدوات التي يحتاجونها لتأمين البنية التحتية الرقمية العالمية.

النقاط الرئيسية

  • استراتيجية النماذج الطبقية: تقدم OpenAI تسلسلاً هرمياً جديداً — Sol (الرائد)، وTerra (المتوسط)، وLuna (الاقتصادي) — إلى جانب وضع "Ultra" لتنفيذ المهام عبر وكلاء فرعيين بالتوازي.
  • الهيمنة على المعايير القياسية: يتصدر GPT-5.6 Sol Ultra الصناعة في البرمجة الوكيلية بنسبة 91.9% في اختبار Terminal-Bench 2.1، متفوقاً بشكل كبير على Claude Mythos وGemini.
  • نهج الكفاءة أولاً: يحقق Sol نتائج تنافسية في الأمن السيبراني وعلم الجينوم مع استخدام عدد أقل بكثير من الـ tokens، مما قد يقلل التكلفة الفعلية لكل مهمة للمطورين.