OpenAI запускает GPT 5.6 Sol, чтобы бросить вызов Claude Mythos

Translated for your language. Читать оригинал.

AI-assisted draft.

GyaanSetu Editorialна прошлой неделе3мин чтения

OpenAI запускает GPT 5.6 Sol, чтобы бросить вызов Claude Mythos

В этой статье

OpenAI выпускает GPT-5.6 Sol, чтобы бросить вызов Claude Mythos

OpenAI официально представила GPT-5.6 Sol — новое высокотехнологичное поколение моделей, призванное доминировать в секторах агентного программирования и кибербезопасности. Хотя этот релиз знаменует собой значительный скачок в возможностях рассуждения, он сопровождается нарастающими спорами вокруг ограничительных протоколов доступа со стороны правительства США.

Новая многоуровневая архитектура для производительности и масштабируемости

Отходя от практики выпуска одиночных моделей, OpenAI представила многоуровневую схему именования, разработанную для удовлетворения разнообразных корпоративных потребностей. Эта архитектура использует «Sol», «Terra» и «Luna» в качестве постоянных уровней производительности, позволяя разработчикам масштабировать решения в зависимости от бюджета и сложности задач.

На вершине иерархии находится Sol — флагманская модель. Ниже расположена Terra, производительность которой соответствует GPT-5.5 примерно при половине стоимости, и Luna — бюджетный уровень. Для высокоинтенсивных рабочих нагрузок OpenAI представила режим «max» для глубокого рассуждения и режим «ultra», который использует параллельно работающих субагентов для решения многогранных и сложных задач.

Новые стандарты в программировании и биологии

Основная цель GPT-5.6 Sol — опередить класс моделей Claude Mythos от Anthropic. В задачах агентного программирования цифры подтверждают заявления OpenAI: в бенчмарке Terminal-Bench 2.1 Sol Ultra достигла ошеломляющих 91,9%, превзойдя Claude Mythos 5 (88,0%) и Google Gemini 3.1 Pro Preview (70,7%).

Модель также демонстрирует значительные прорывы в специализированных науках. В геномном бенчмарке GeneBench v1 модель Sol набрала 30%, что является существенным ростом по сравнению с 22%, достигнутыми GPT-5.5, причем при заметно меньшем потреблении токенов. Такая эффективность говорит о том, что OpenAI делает ставку на «умные» вычисления, а не просто на их «масштаб».

Кибербезопасность: защитник против атакующего

В сфере кибербезопасности Sol стремится стать первоклассным инструментом защиты. В ExploitBench — тесте на способность находить и использовать уязвимости в движке JavaScript Google V8 — Sol демонстрирует производительность на уровне Anthropic Mythos Preview, но с критическим преимуществом: она использует примерно в три раза меньше выходных токенов.

OpenAI позиционирует Sol как защитника, а не автономного атакующего. В тестах с участием Chromium и Firefox модель успешно идентифицировала баги и примитивы эксплуатации, но не дошла до создания автономного эксплойта полной цепочки. OpenAI утверждает, что Sol остается ниже порога «Cyber Critical» в рамках своей внутренней структуры обеспечения безопасности (Preparedness Framework).

Споры вокруг государственного контроля доступа

Внедрение GPT-5.6 Sol не обходится без трений. В настоящее время доступ ограничен лишь несколькими избранными партнерами через API и Codex — это ограничение, предписанное правительством США. Это последовало за предыдущим решением властей вывести с рынка модель Anthropic Fable 5.

OpenAI выразила решительный протест против этих ограничений, назвав текущий процесс государственного контроля доступа «неприемлемым». Компания утверждает, что подобные меры мешают разработчикам, предприятиям и специалистам по киберзащите получать доступ к тем самым инструментам, которые необходимы для обеспечения безопасности глобальной цифровой инфраструктуры.

Основные выводы

Стратегия многоуровневых моделей: OpenAI вводит новую иерархию — Sol (флагман), Terra (средний уровень) и Luna (бюджетный) — наряду с режимом «Ultra» для параллельного выполнения задач субагентами.
Доминирование в бенчмарках: GPT-5.6 Sol Ultra лидирует в отрасли в области агентного программирования с результатом 91,9% в Terminal-Bench 2.1, значительно опережая Claude Mythos и Gemini.
Приоритет эффективности: Sol достигает конкурентоспособных результатов в кибербезопасности и геномике, используя при этом значительно меньше токенов, что потенциально снижает эффективную стоимость выполнения задач для разработчиков.

OpenAI запускает GPT 5.6 Sol, чтобы бросить вызов Claude Mythos

OpenAI выпускает GPT-5.6 Sol, чтобы бросить вызов Claude Mythos

Новая многоуровневая архитектура для производительности и масштабируемости

Новые стандарты в программировании и биологии

Кибербезопасность: защитник против атакующего

Споры вокруг государственного контроля доступа

Основные выводы

Продолжить чтение

OpenAI запускает линейку GPT 5.6 на фоне пристального внимания со стороны регуляторов США

OpenAI ограничивает выпуск GPT 5.6 по запросу правительства США

GPT 5.6 Sol от OpenAI уличен в обмане при прохождении программных тестов

GTP 5.6 Sol: OpenAI's Access Wall Explained

GPT 5.6 — это запуск модели. Настоящая суть заключается в списке доступа.