OpenAI, 자동 패치 기술의 혁신을 위한 GPT-5.5-Cyber 공개
OpenAI가 기존 업계 벤치마크를 뛰어넘도록 설계된 특화 모델인 GPT-5.5-Cyber를 정식 출시하며 사이버 보안 분야의 AI 군비 경쟁을 본격화하고 있습니다. 단순한 취약점 탐지를 넘어 자동 패치 생성 단계로 나아감으로써, OpenAI는 결함을 발견하는 것과 이를 수정하는 것 사이의 결정적인 간극을 메우는 것을 목표로 합니다.
벤치마크 성과: GPT-5.5-Cyber vs. Mythos
GPT-5.5-Cyber의 출시는 특화된 LLM 성능 측면에서 중요한 이정표가 될 것입니다. OpenAI에 따르면, 이 새로운 모델은 주요 보안 벤치마크에서 최고 기록을 경신했으며, 특히 Anthropic의 Mythos 5를 능가하는 성능을 보여주었습니다. 알려진 결함을 재현하는 에이전트의 능력을 측정하는 CyberGym 벤치마크에서 GPT-5.5-Cyber는 85.6%의 점수를 기록하며, Mythos 5의 83.8%와 표준 GPT-5의 81.8%를 넘어섰습니다.
더욱 놀라운 점은 ExploitGym에서의 성과입니다. GPT-5.5-Cyber는 39.5%를 기록하며, 기본 GPT-5 모델이 기록한 25.95%의 거의 두 배에 달하는 수치를 보여주었습니다. 장기적인 취약점 발견 능력을 평가하는 SEC-bench Pro에서 이 모델은 69.8%를 기록하며, Claude Opus 4(CyberGym에서 73.1%) 및 이전 버전들에 비해 상당한 우위를 유지했습니다. 이러한 수치는 GPT-5.5-Cyber가 공격 및 방어 보안 연구에 필요한 미묘한 논리에 맞춰 특별히 미세 조정(fine-tuned)되었음을 시사합니다.
Codex Security를 통한 프로세스 완성
Daybreak 사이버 보안 이니셔티브의 핵심 요소는 업데이트된 Codex Security 플러그인입니다. 많은 도구가 스캐닝에만 집중하는 반면, 업데이트된 Codex Security는 발견부터 패치 생성에 이르는 전체 파이프라인을 관리합니다. 지난 3월 리서치 프리뷰 출시 이후, 이 플러그인은 30,000개의 코드베이스에 걸쳐 3,000만 개 이상의 커밋을 스캔하여 50만 개의 자동 플래그 수정 사항을 찾아냈습니다.
이 플러그인은 가상 보안 엔지니어처럼 작동하며, 전체 코드베이스에 대한 심층 스캔을 수행하고, 공격 경로 분석을 실시하며, 취약한 코드가 실제로 도달 가능한지(reachable) 확인합니다. 중요한 점은 SARIF 파일이나 CodeQL 쿼리를 통해 분석 결과를 내보냄으로써 현대적인 개발자 워크플로우를 지원한다는 것입니다. "환각(hallucination)" 현상으로 인한 잘못된 보안 수정을 방지하기 위해, OpenAI는 모든 변경 사항에 대해 여전히 인간 엔지니어의 최종 승인이 필요함을 강조합니다.
글로벌 방어 생태계
OpenAI는 이를 단독으로 구축하는 것이 아니라, Daybreak Cyber Partner Program을 통해 거대한 파트너 네트워크를 구축하고 있습니다. 이 프로그램에는 CrowdStrike, Cisco, Cloudflare, Palo Alto Networks, IBM, SentinelOne과 같은 업계 거물들이 포함되어 있습니다. 이 기업들은 GPT-5.5의 "Trusted Access for Cyber" 기능을 자사의 독자적인 보안 제품에 직접 통합할 수 있습니다.
또한, 이 이니셔티브는 공공 부문과 오픈 소스 안정성으로까지 확장됩니다. OpenAI는 호주, 캐나다, 프랑스, 독일, 일본, 영국을 포함한 정부들과 Trusted Access 파트너십을 체결했습니다. 오픈 소스 분야에서는 Trail of Bits 및 HackerOne과 협력하는 "Patch the Planet" 이니셔티브를 통해 cURL, Go, Python과 같은 핵심 프로젝트를 대상으로 인터넷의 기반을 보호하는 작업을 이미 진행 중입니다.
핵심 요약
- 우수한 벤치마크 성능: GPT-5.5-Cyber는 CyberGym 및 ExploitGym과 같은 주요 업계 테스트를 주도하며, Anthropic의 Mythos와 표준 GPT-5 모델을 모두 능가합니다.
- 엔드 투 엔드(End-to-End) 자동화: Codex Security 플러그인은 취약점 발견에서 패치 생성으로 이어지는 과정을 자동화하며, 심층 스캔 및 공격 경로 분석을 지원합니다.
- 검증된 사용자에게만 허용된 접근: 리스크를 완화하기 위해, 권한이 매우 높은 GPT-5.5-Cyber 모델은 엄격한 모니터링과 가드레일 하에 검증된 방어자(defenders)로 사용이 제한됩니다.
