OpenAI revela GPT-5.5-Cyber para revolucionar a aplicação de patches automatizada

A OpenAI está escalando significativamente a corrida armamentista de IA em cibersegurança com o lançamento completo do GPT-5.5-Cyber, um modelo especializado projetado para superar os benchmarks atuais do setor. Ao ir além da simples detecção de vulnerabilidades para a geração automatizada de patches, a OpenAI visa preencher a lacuna crítica entre encontrar falhas e corrigi-las.

Sucesso em Benchmarks: GPT-5.5-Cyber vs. Mythos

O lançamento do GPT-5.5-Cyber marca um grande marco no desempenho de LLMs especializados. De acordo com a OpenAI, o novo modelo estabelece novos recordes em benchmarks de segurança críticos, superando notavelmente o Mythos 5 da Anthropic. No benchmark CyberGym, que mede a capacidade de um agente de reproduzir falhas conhecidas, o GPT-5.5-Cyber alcançou uma pontuação de 85,6%, superando os 83,8% do Mythos 5 e os 81,8% do GPT-5 padrão.

Ainda mais impressionante é o desempenho no ExploitGym, onde o GPT-5.5-Cyber atingiu 39,5%, quase o dobro dos 25,95% registrados pelo modelo base GPT-5. No SEC-bench Pro, que avalia a descoberta de vulnerabilidades a longo prazo, o modelo obteve 69,8%, mantendo uma liderança significativa sobre o Claude Opus 4 (73,1% no CyberGym) e iterações anteriores. Esses números sugerem que o GPT-5.5-Cyber é especificamente ajustado para a lógica sutil necessária na pesquisa de segurança ofensiva e defensiva.

Fechando o Ciclo com Codex Security

Um componente central da iniciativa de cibersegurança Daybreak é o plugin Codex Security atualizado. Enquanto muitas ferramentas focam apenas na varredura, o Codex Security atualizado gerencia todo o pipeline, desde a descoberta até a geração de patches. Desde sua prévia de pesquisa em março, o plugin varreu mais de 30 milhões de commits em 30.000 bases de código, resultando em 500.000 correções sinalizadas automaticamente.

O plugin funciona como um engenheiro de segurança virtual, realizando varreduras profundas de bases de código inteiras, conduzindo análises de caminhos de ataque e verificando se o código vulnerável é realmente acessível. Crucialmente, ele suporta fluxos de trabalho modernos de desenvolvedores ao exportar descobertas via arquivos SARIF ou consultas CodeQL. Para evitar correções de segurança "alucinadas", a OpenAI enfatiza que engenheiros humanos ainda devem aprovar cada alteração.

Um Ecossistema de Defesa Global

A OpenAI não está construindo isso isoladamente; ela está construindo uma rede massiva de parceiros por meio do Daybreak Cyber Partner Program. O programa inclui gigantes do setor, como CrowdStrike, Cisco, Cloudflare, Palo Alto Networks, IBM e SentinelOne. Essas empresas podem integrar o GPT-5.5 com o "Trusted Access for Cyber" diretamente em seus produtos de segurança proprietários.

Além disso, a iniciativa se estende ao setor público e à estabilidade do código aberto. A OpenAI estabeleceu parcerias de Trusted Access com governos, incluindo Austrália, Canadá, França, Alemanha, Japão e Reino Unido. Na frente do código aberto, a iniciativa "Patch the Planet" — em parceria com Trail of Bits e HackerOne — já está trabalhando em projetos críticos como cURL, Go e Python para proteger a base da internet.

Principais Conclusões

  • Benchmarks Superiores: O GPT-5.5-Cyber lidera testes importantes do setor, como CyberGym e ExploitGym, superando tanto o Mythos da Anthropic quanto os modelos GPT-5 padrão.
  • Automação de Ponta a Ponta: O plugin Codex Security automatiza a transição da descoberta de vulnerabilidades para a geração de patches, suportando varreduras profundas e análise de caminhos de ataque.
  • Acesso Apenas para Verificados: Para mitigar riscos, o modelo altamente permissivo GPT-5.5-Cyber é restrito a defensores verificados sob monitoramento rigoroso e salvaguardas.