OpenAI prezentuje GPT-5.5-Cyber, aby zrewolucjonizować automatyczne łatanie luk
OpenAI znacząco zaostrza wyścig zbrojeń w dziedzinie AI w cyberbezpieczeństwie poprzez pełne wydanie GPT-5.5-Cyber – wyspecjalizowanego modelu zaprojektowanego tak, aby przewyższać istniejące standardy branżowe. Przechodząc od prostej detekcji podatności do automatycznego generowania poprawek, OpenAI dąży do wypełnienia krytycznej luki między wykrywaniem błędów a ich naprawianiem.
Sukces w benchmarkach: GPT-5.5-Cyber vs. Mythos
Wydanie GPT-5.5-Cyber stanowi kamień milowy w wydajności wyspecjalizowanych modeli LLM. Według OpenAI nowy model ustanawia nowe rekordy w kluczowych benchmarkach bezpieczeństwa, znacząco przewyższając Mythos 5 od Anthropic. W benchmarku CyberGym, który mierzy zdolność agenta do reprodukowania znanych luk, GPT-5.5-Cyber osiągnął wynik 85,6%, przebijając 83,8% Mythos 5 oraz 81,8% standardowego modelu GPT-5.
Jeszcze bardziej uderzające są wyniki w ExploitGym, gdzie GPT-5.5-Cyber osiągnął 39,5%, co stanowi niemal dwukrotność wyniku 25,95% zarejestrowanego przez podstawowy model GPT-5. W SEC-bench Pro, który ocenia długoterminowe wykrywanie podatności, model uzyskał 69,8%, utrzymując znaczną przewagę nad Claude Opus 4 (73,1% w CyberGym) oraz poprzednimi iteracjami. Liczby te sugerują, że GPT-5.5-Cyber został specjalnie dostrojony pod kątem niuansów logicznych wymaganych w badaniach nad bezpieczeństwem ofensywnym i defensywnym.
Zamykanie cyklu dzięki Codex Security
Centralnym elementem inicjatywy cyberbezpieczeństwa Daybreak jest zaktualizowana wtyczka Codex Security. Podczas gdy wiele narzędzi skupia się wyłącznie na skanowaniu, zaktualizowany Codex Security zarządza całym procesem – od wykrycia do wygenerowania poprawki. Od czasu wersji demonstracyjnej (research preview) w marcu, wtyczka przeanalizowała ponad 30 milionów commitów w 30 000 bazach kodu, co zaowocowało 500 000 automatycznie oznaczonych poprawek.
Wtyczka działa jak wirtualny inżynier bezpieczeństwa, przeprowadzając głębokie skanowanie całych baz kodu, analizę ścieżek ataku oraz sprawdzając, czy podatny kod jest faktycznie osiągalny. Co kluczowe, wspiera ona nowoczesne procesy pracy programistów, eksportując wyniki za pomocą plików SARIF lub zapytań CodeQL. Aby zapobiec „halucynowanym” poprawkom bezpieczeństwa, OpenAI podkreśla, że inżynierowie muszą nadal zatwierdzać każdą zmianę.
Globalny ekosystem obronny
OpenAI nie buduje tego w izolacji; tworzy ogromną sieć partnerów w ramach Daybreak Cyber Partner Program. Program obejmuje gigantów branżowych, takich jak CrowdStrike, Cisco, Cloudflare, Palo Alto Networks, IBM i SentinelOne. Firmy te mogą integrować GPT-5.5 z funkcją „Trusted Access for Cyber” bezpośrednio w swoich autorskich produktach bezpieczeństwa.
Co więcej, inicjatywa rozciąga się na sektor publiczny oraz stabilność oprogramowania open-source. OpenAI nawiązało partnerstwa Trusted Access z rządami m.in. Australii, Kanady, Francji, Niemiec, Japonii i Wielkiej Brytanii. Na polu open-source inicjatywa „Patch the Planet” – we współpracy z Trail of Bits i HackerOne – pracuje już nad krytycznymi projektami, takimi jak cURL, Go i Python, aby zabezpieczyć fundamenty internetu.
Kluczowe wnioski
- Wybitne wyniki w benchmarkach: GPT-5.5-Cyber dominuje w kluczowych testach branżowych, takich jak CyberGym i ExploitGym, przewyższając zarówno Mythos od Anthropic, jak i standardowe modele GPT-5.
- Automatyzacja end-to-end: Wtyczka Codex Security automatyzuje przejście od wykrycia podatności do wygenerowania poprawki, wspierając głębokie skanowanie i analizę ścieżek ataku.
- Tylko zweryfikowany dostęp: Aby zminimalizować ryzyko, wysoce uprawniony model GPT-5.5-Cyber jest ograniczony do zweryfikowanych obrońców i podlega ścisłemu monitorowaniu oraz zabezpieczeniom (guardrails).
