OpenAI Unveils GPT 5.5 Cyber to Revolutionize Automated Patching

Translated for your language. Ler o original.

AI-assisted draft.

GyaanSetu Editorialhá 2 semanas2min de leitura

OpenAI Unveils GPT 5.5 Cyber to Revolutionize Automated Patching

Neste artigo

OpenAI revela GPT-5.5-Cyber para revolucionar a aplicação de patches automatizada

A OpenAI está escalando significativamente a corrida armamentista de IA em cibersegurança com o lançamento completo do GPT-5.5-Cyber, um modelo especializado projetado para superar os benchmarks atuais do setor. Ao ir além da simples detecção de vulnerabilidades para a geração automatizada de patches, a OpenAI visa preencher a lacuna crítica entre encontrar falhas e corrigi-las.

Sucesso em Benchmarks: GPT-5.5-Cyber vs. Mythos

O lançamento do GPT-5.5-Cyber marca um grande marco no desempenho de LLMs especializados. De acordo com a OpenAI, o novo modelo estabelece novos recordes em benchmarks de segurança críticos, superando notavelmente o Mythos 5 da Anthropic. No benchmark CyberGym, que mede a capacidade de um agente de reproduzir falhas conhecidas, o GPT-5.5-Cyber alcançou uma pontuação de 85,6%, superando os 83,8% do Mythos 5 e os 81,8% do GPT-5 padrão.

Ainda mais impressionante é o desempenho no ExploitGym, onde o GPT-5.5-Cyber atingiu 39,5%, quase o dobro dos 25,95% registrados pelo modelo base GPT-5. No SEC-bench Pro, que avalia a descoberta de vulnerabilidades a longo prazo, o modelo obteve 69,8%, mantendo uma liderança significativa sobre o Claude Opus 4 (73,1% no CyberGym) e iterações anteriores. Esses números sugerem que o GPT-5.5-Cyber é especificamente ajustado para a lógica sutil necessária na pesquisa de segurança ofensiva e defensiva.

Fechando o Ciclo com Codex Security

Um componente central da iniciativa de cibersegurança Daybreak é o plugin Codex Security atualizado. Enquanto muitas ferramentas focam apenas na varredura, o Codex Security atualizado gerencia todo o pipeline, desde a descoberta até a geração de patches. Desde sua prévia de pesquisa em março, o plugin varreu mais de 30 milhões de commits em 30.000 bases de código, resultando em 500.000 correções sinalizadas automaticamente.

O plugin funciona como um engenheiro de segurança virtual, realizando varreduras profundas de bases de código inteiras, conduzindo análises de caminhos de ataque e verificando se o código vulnerável é realmente acessível. Crucialmente, ele suporta fluxos de trabalho modernos de desenvolvedores ao exportar descobertas via arquivos SARIF ou consultas CodeQL. Para evitar correções de segurança "alucinadas", a OpenAI enfatiza que engenheiros humanos ainda devem aprovar cada alteração.

Um Ecossistema de Defesa Global

A OpenAI não está construindo isso isoladamente; ela está construindo uma rede massiva de parceiros por meio do Daybreak Cyber Partner Program. O programa inclui gigantes do setor, como CrowdStrike, Cisco, Cloudflare, Palo Alto Networks, IBM e SentinelOne. Essas empresas podem integrar o GPT-5.5 com o "Trusted Access for Cyber" diretamente em seus produtos de segurança proprietários.

Além disso, a iniciativa se estende ao setor público e à estabilidade do código aberto. A OpenAI estabeleceu parcerias de Trusted Access com governos, incluindo Austrália, Canadá, França, Alemanha, Japão e Reino Unido. Na frente do código aberto, a iniciativa "Patch the Planet" — em parceria com Trail of Bits e HackerOne — já está trabalhando em projetos críticos como cURL, Go e Python para proteger a base da internet.

Principais Conclusões

Benchmarks Superiores: O GPT-5.5-Cyber lidera testes importantes do setor, como CyberGym e ExploitGym, superando tanto o Mythos da Anthropic quanto os modelos GPT-5 padrão.
Automação de Ponta a Ponta: O plugin Codex Security automatiza a transição da descoberta de vulnerabilidades para a geração de patches, suportando varreduras profundas e análise de caminhos de ataque.
Acesso Apenas para Verificados: Para mitigar riscos, o modelo altamente permissivo GPT-5.5-Cyber é restrito a defensores verificados sob monitoramento rigoroso e salvaguardas.

OpenAI Unveils GPT 5.5 Cyber to Revolutionize Automated Patching

OpenAI revela GPT-5.5-Cyber para revolucionar a aplicação de patches automatizada

Sucesso em Benchmarks: GPT-5.5-Cyber vs. Mythos

Fechando o Ciclo com Codex Security

Um Ecossistema de Defesa Global

Principais Conclusões

Continuar lendo

GPT 5.5 Instant da OpenAI supera médicos em novo benchmark de saúde

OpenAI lança Patch the Planet para proteger ecossistemas de código aberto

OpenAI adia lançamento do GPT 5.6 após solicitação do governo Trump

Governo dos EUA exige aprovação em nível de cliente para o lançamento do GPT 5.6

OpenAI lança GPT 5.6 Sol para desafiar o Claude Mythos