OpenAI, Otomatik Yamalamada Devrim Yaratmak İçin GPT-5.5-Cyber'ı Tanıttı
OpenAI, mevcut endüstri standartlarını geride bırakmak üzere tasarlanmış özel bir model olan GPT-5.5-Cyber'ın tam sürümünü yayınlayarak siber güvenlikteki yapay zeka silahlanma yarışını önemli ölçüde tırmandırıyor. OpenAI, basit zafiyet tespitinin ötesine geçip otomatik yama üretimine odaklanarak, kusurları bulmak ile onları düzeltmek arasındaki kritik boşluğu kapatmayı hedefliyor.
Kıyaslama Başarısı: GPT-5.5-Cyber vs. Mythos
GPT-5.5-Cyber'ın piyasaya sürülmesi, özel LLM performansında büyük bir dönüm noktasını temsil ediyor. OpenAI'a göre yeni model, kritik güvenlik kıyaslamalarında yeni rekorlar kırıyor ve özellikle Anthropic'in Mythos 5 modelinden daha iyi performans gösteriyor. Bir ajanın bilinen kusurları yeniden üretme yeteneğini ölçen CyberGym kıyaslamasında GPT-5.5-Cyber, %85,6'lık bir puan alarak Mythos 5'in %83,8'lik ve standart GPT-5'in %81,8'lik skorlarını geride bıraktı.
ExploitGym üzerindeki performans ise daha da çarpıcı; burada GPT-5.5-Cyber %39,5'e ulaşarak temel GPT-5 modelinin kaydettiği %25,95'lik oranın neredeyse iki katına çıktı. Uzun vadeli zafiyet keşfini değerlendiren SEC-bench Pro'da ise model %69,8 puan alarak Claude Opus 4 (CyberGym'de %73,1) ve önceki sürümler karşısında önemli bir üstünlük sağladı. Bu rakamlar, GPT-5.5-Cyber'ın ofansif ve defansif güvenlik araştırmalarında gereken nüanslı mantık için özel olarak ince ayarlandığını (fine-tuned) gösteriyor.
Codex Security ile Döngüyü Tamamlamak
Daybreak siber güvenlik girişiminin merkezi bir bileşeni, güncellenmiş Codex Security eklentisidir. Birçok araç yalnızca taramaya odaklanırken, güncellenmiş Codex Security keşiften yama üretimine kadar tüm süreci yönetiyor. Mart ayındaki araştırma ön izlemesinden bu yana eklenti, 30.000 kod tabanı üzerinde 30 milyondan fazla commit'i taradı ve 500.000 otomatik olarak işaretlenmiş düzeltme sağladı.
Eklenti; tüm kod tabanlarının derinlemesine taramasını yaparak, saldırı yolu analizi gerçekleştirerek ve savunmasız kodun gerçekten erişilebilir olup olmadığını kontrol ederek sanal bir güvenlik mühendisi gibi çalışıyor. Kritik bir nokta olarak, bulguları SARIF dosyaları veya CodeQL sorguları aracılığıyla dışa aktararak modern geliştirici iş akışlarını destekliyor. OpenAI, "halüsinasyon" kaynaklı güvenlik düzeltmelerini önlemek için insan mühendislerin her değişikliği hâlâ onaylaması gerektiğini vurguluyor.
Küresel Bir Savunma Ekosistemi
OpenAI bunu tek başına inşa etmiyor; Daybreak Cyber Partner Programı aracılığıyla devasa bir ortak ağı kuruyor. Program; CrowdStrike, Cisco, Cloudflare, Palo Alto Networks, IBM ve SentinelOne gibi sektör devlerini içeriyor. Bu firmalar, GPT-5.5'i "Trusted Access for Cyber" ile doğrudan kendi tescilli güvenlik ürünlerine entegre edebilirler.
Ayrıca girişim, kamu sektörüne ve açık kaynak istikrarına da uzanıyor. OpenAI; Avustralya, Kanada, Fransa, Almanya, Japonya ve Birleşik Krallık dahil olmak üzere çeşitli hükümetlerle "Trusted Access" ortaklıkları kurdu. Açık kaynak cephesinde ise Trail of Bits ve HackerOne ile ortaklık kuran "Patch the Planet" girişimi, internetin temelini güvence altına almak için cURL, Go ve Python gibi kritik projeler üzerinde halihazırda çalışıyor.
Önemli Çıkarımlar
- Üstün Kıyaslama Sonuçları: GPT-5.5-Cyber; CyberGym ve ExploitGym gibi temel endüstri testlerinde liderlik ederek hem Anthropic'in Mythos modelini hem de standart GPT-5 modellerini geride bırakıyor.
- Uçtan Uca Otomasyon: Codex Security eklentisi, zafiyet keşfinden yama üretimine geçişi otomatikleştirerek derin taramaları ve saldırı yolu analizini destekliyor.
- Yalnızca Denetlenmiş Erişim: Riskleri azaltmak için, oldukça yetkili olan GPT-5.5-Cyber modeli, sıkı izleme ve koruma mekanizmaları altında yalnızca doğrulanmış savunmacılarla sınırlandırılmıştır.
