OpenAI представляет GPT-5.5-Cyber для революции в области автоматизированного исправления уязвимостей

OpenAI значительно обостряет гонку вооружений в сфере ИИ для кибербезопасности, выпуская полнофункциональную версию GPT-5.5-Cyber — специализированную модель, разработанную для превосходства над существующими отраслевыми стандартами. Переходя от простого обнаружения уязвимостей к автоматической генерации патчей, OpenAI стремится устранить критический разрыв между поиском брешей и их устранением.

Успехи в бенчмарках: GPT-5.5-Cyber против Mythos

Выпуск GPT-5.5-Cyber знаменует собой важную веху в производительности специализированных LLM. По данным OpenAI, новая модель устанавливает новые рекорды в критически важных бенчмарках безопасности, заметно превосходя Mythos 5 от Anthropic. В бенчмарке CyberGym, который измеряет способность агента воспроизводить известные уязвимости, GPT-5.5-Cyber достигла показателя 85,6%, опередив Mythos 5 (83,8%) и стандартную GPT-5 (81,8%).

Еще более впечатляющими являются результаты в ExploitGym, где GPT-5.5-Cyber достигла 39,5%, что почти вдвое превышает показатель базовой модели GPT-5 (25,95%). В SEC-bench Pro, который оценивает долгосрочное обнаружение уязвимостей, модель набрала 69,8%, сохраняя значительный отрыв от Claude Opus 4 (73,1% в CyberGym) и предыдущих итераций. Эти цифры позволяют предположить, что GPT-5.5-Cyber специально дообучена для работы с тонкой логикой, необходимой в исследованиях в области наступательной (offensive) и оборонительной (defensive) безопасности.

Замыкая цикл с помощью Codex Security

Центральным компонентом инициативы по кибербезопасности Daybreak является обновленный плагин Codex Security. В то время как многие инструменты фокусируются исключительно на сканировании, обновленный Codex Security управляет всем циклом — от обнаружения до генерации патча. С момента исследовательского превью в марте плагин просканировал более 30 миллионов коммитов в 30 000 кодовых баз, что привело к 500 000 автоматически помеченных исправлений.

Плагин функционирует как виртуальный инженер по безопасности, выполняя глубокое сканирование целых кодовых баз, проводя анализ путей атак и проверяя, достижим ли уязвимый код на самом деле. Что крайне важно, он поддерживает современные рабочие процессы разработчиков, экспортируя результаты через файлы SARIF или запросы CodeQL. Чтобы предотвратить «галлюцинации» в исправлениях безопасности, OpenAI подчеркивает, что инженеры-люди по-прежнему должны одобрять каждое изменение.

Глобальная экосистема защиты

OpenAI не строит это в изоляции; компания создает масштабную партнерскую сеть через программу Daybreak Cyber Partner Program. В программу входят такие гиганты индустрии, как CrowdStrike, Cisco, Cloudflare, Palo Alto Networks, IBM и SentinelOne. Эти фирмы могут интегрировать GPT-5.5 с функцией «Trusted Access for Cyber» непосредственно в свои проприетарные продукты безопасности.

Кроме того, инициатива охватывает государственный сектор и обеспечение стабильности open-source проектов. OpenAI установила партнерские отношения в рамках Trusted Access с правительствами Австралии, Канады, Франции, Германии, Японии и Великобритании. На фронте открытого ПО инициатива «Patch the Planet» — в партнерстве с Trail of Bits и HackerOne — уже работает над критически важными проектами, такими как cURL, Go и Python, чтобы обезопасить фундамент интернета.

Основные выводы

  • Превосходные показатели: GPT-5.5-Cyber лидирует в ключевых отраслевых тестах, таких как CyberGym и ExploitGym, превосходя как Mythos от Anthropic, так и стандартные модели GPT-5.
  • Сквозная автоматизация: Плагин Codex Security автоматизирует переход от обнаружения уязвимостей к генерации патчей, поддерживая глубокое сканирование и анализ путей атак.
  • Только проверенный доступ: Чтобы минимизировать риски, обладающая широкими возможностями модель GPT-5.5-Cyber доступна только проверенным специалистам по защите под строгим мониторингом и контролем.