OpenAI выпускает GPT-5.6 Sol, чтобы бросить вызов Claude Mythos
OpenAI официально представила GPT-5.6 Sol — новое высокотехнологичное поколение моделей, призванное доминировать в секторах агентного программирования и кибербезопасности. Хотя этот релиз знаменует собой значительный скачок в возможностях рассуждения, он сопровождается нарастающими спорами вокруг ограничительных протоколов доступа со стороны правительства США.
Новая многоуровневая архитектура для производительности и масштабируемости
Отходя от практики выпуска одиночных моделей, OpenAI представила многоуровневую схему именования, разработанную для удовлетворения разнообразных корпоративных потребностей. Эта архитектура использует «Sol», «Terra» и «Luna» в качестве постоянных уровней производительности, позволяя разработчикам масштабировать решения в зависимости от бюджета и сложности задач.
На вершине иерархии находится Sol — флагманская модель. Ниже расположена Terra, производительность которой соответствует GPT-5.5 примерно при половине стоимости, и Luna — бюджетный уровень. Для высокоинтенсивных рабочих нагрузок OpenAI представила режим «max» для глубокого рассуждения и режим «ultra», который использует параллельно работающих субагентов для решения многогранных и сложных задач.
Новые стандарты в программировании и биологии
Основная цель GPT-5.6 Sol — опередить класс моделей Claude Mythos от Anthropic. В задачах агентного программирования цифры подтверждают заявления OpenAI: в бенчмарке Terminal-Bench 2.1 Sol Ultra достигла ошеломляющих 91,9%, превзойдя Claude Mythos 5 (88,0%) и Google Gemini 3.1 Pro Preview (70,7%).
Модель также демонстрирует значительные прорывы в специализированных науках. В геномном бенчмарке GeneBench v1 модель Sol набрала 30%, что является существенным ростом по сравнению с 22%, достигнутыми GPT-5.5, причем при заметно меньшем потреблении токенов. Такая эффективность говорит о том, что OpenAI делает ставку на «умные» вычисления, а не просто на их «масштаб».
Кибербезопасность: защитник против атакующего
В сфере кибербезопасности Sol стремится стать первоклассным инструментом защиты. В ExploitBench — тесте на способность находить и использовать уязвимости в движке JavaScript Google V8 — Sol демонстрирует производительность на уровне Anthropic Mythos Preview, но с критическим преимуществом: она использует примерно в три раза меньше выходных токенов.
OpenAI позиционирует Sol как защитника, а не автономного атакующего. В тестах с участием Chromium и Firefox модель успешно идентифицировала баги и примитивы эксплуатации, но не дошла до создания автономного эксплойта полной цепочки. OpenAI утверждает, что Sol остается ниже порога «Cyber Critical» в рамках своей внутренней структуры обеспечения безопасности (Preparedness Framework).
Споры вокруг государственного контроля доступа
Внедрение GPT-5.6 Sol не обходится без трений. В настоящее время доступ ограничен лишь несколькими избранными партнерами через API и Codex — это ограничение, предписанное правительством США. Это последовало за предыдущим решением властей вывести с рынка модель Anthropic Fable 5.
OpenAI выразила решительный протест против этих ограничений, назвав текущий процесс государственного контроля доступа «неприемлемым». Компания утверждает, что подобные меры мешают разработчикам, предприятиям и специалистам по киберзащите получать доступ к тем самым инструментам, которые необходимы для обеспечения безопасности глобальной цифровой инфраструктуры.
Основные выводы
- Стратегия многоуровневых моделей: OpenAI вводит новую иерархию — Sol (флагман), Terra (средний уровень) и Luna (бюджетный) — наряду с режимом «Ultra» для параллельного выполнения задач субагентами.
- Доминирование в бенчмарках: GPT-5.6 Sol Ultra лидирует в отрасли в области агентного программирования с результатом 91,9% в Terminal-Bench 2.1, значительно опережая Claude Mythos и Gemini.
- Приоритет эффективности: Sol достигает конкурентоспособных результатов в кибербезопасности и геномике, используя при этом значительно меньше токенов, что потенциально снижает эффективную стоимость выполнения задач для разработчиков.
