OpenAI Công bố GPT-5.5-Cyber nhằm Cách mạng hóa việc Vá lỗi Tự động

OpenAI đang leo thang đáng kể cuộc chạy đua vũ trang AI trong lĩnh vực an ninh mạng với việc phát hành đầy đủ GPT-5.5-Cyber, một mô hình chuyên dụng được thiết kế để vượt qua các tiêu chuẩn đánh giá (benchmarks) hiện có của ngành. Bằng cách tiến xa hơn việc chỉ phát hiện lỗ hổng đơn thuần để tiến tới tạo bản vá tự động, OpenAI đặt mục tiêu thu hẹp khoảng cách quan trọng giữa việc tìm ra lỗi và việc khắc phục chúng.

Thành công trong việc Đánh giá Hiệu năng: GPT-5.5-Cyber đối đầu với Mythos

Việc phát hành GPT-5.5-Cyber đánh dấu một cột mốc quan trọng trong hiệu suất của các LLM chuyên dụng. Theo OpenAI, mô hình mới này đã thiết lập những kỷ lục mới trên các tiêu chuẩn đánh giá an ninh quan trọng, đặc biệt là vượt qua Mythos 5 của Anthropic. Trong bài kiểm tra CyberGym, vốn đo lường khả năng tái hiện các lỗi đã biết của một tác nhân (agent), GPT-5.5-Cyber đã đạt được số điểm 85,6%, vượt qua mức 83,8% của Mythos 5 và 81,8% của mô hình GPT-5 tiêu chuẩn.

Đáng chú ý hơn nữa là hiệu suất trên ExploitGym, nơi GPT-5.5-Cyber đạt 39,5%, gần gấp đôi mức 25,95% được ghi nhận bởi mô hình GPT-5 cơ bản. Trên SEC-bench Pro, công cụ đánh giá khả năng phát hiện lỗ hổng dài hạn, mô hình đạt 69,8%, duy trì khoảng cách dẫn trước đáng kể so với Claude Opus 4 (73,1% trong CyberGym) và các phiên bản trước đó. Những con số này cho thấy GPT-5.5-Cyber được tinh chỉnh (fine-tuned) đặc biệt cho các logic sắc thái cần thiết trong nghiên cứu an ninh tấn công và phòng thủ.

Hoàn thiện Quy trình với Codex Security

Một thành phần trung tâm của sáng kiến an ninh mạng Daybreak là plugin Codex Security đã được cập nhật. Trong khi nhiều công cụ chỉ tập trung vào việc quét, Codex Security phiên bản mới quản lý toàn bộ quy trình từ phát hiện đến tạo bản vá. Kể từ bản xem trước nghiên cứu vào tháng 3, plugin này đã quét hơn 30 triệu commit trên 30.000 kho mã nguồn (codebases), dẫn đến 500.000 lỗi được gắn cờ khắc phục tự động.

Plugin này hoạt động như một kỹ sư an ninh ảo, thực hiện quét sâu toàn bộ kho mã nguồn, tiến hành phân tích đường dẫn tấn công (attack path analysis) và kiểm tra xem mã lỗi có thực sự có thể bị khai thác hay không. Quan trọng hơn, nó hỗ trợ các quy trình làm việc hiện đại của nhà phát triển bằng cách xuất các kết quả tìm thấy thông qua tệp SARIF hoặc các truy vấn CodeQL. Để ngăn chặn các bản sửa lỗi an ninh bị "ảo giác" (hallucinated), OpenAI nhấn mạnh rằng các kỹ sư con người vẫn phải phê duyệt mọi thay đổi.

Một Hệ sinh thái Phòng thủ Toàn cầu

OpenAI không xây dựng điều này một cách cô lập; họ đang xây dựng một mạng lưới đối tác khổng lồ thông qua Chương trình Đối tác An ninh mạng Daybreak (Daybreak Cyber Partner Program). Chương trình bao gồm các gã khổng lồ trong ngành như CrowdStrike, Cisco, Cloudflare, Palo Alto Networks, IBM và SentinelOne. Các công ty này có thể tích hợp GPT-5.5 với "Trusted Access for Cyber" trực tiếp vào các sản phẩm bảo mật độc quyền của họ.

Hơn nữa, sáng kiến này còn mở rộng sang khu vực công và sự ổn định của mã nguồn mở. OpenAI đã thiết lập các quan hệ đối tác Truy cập Tin cậy (Trusted Access) với các chính phủ bao gồm Úc, Canada, Pháp, Đức, Nhật Bản và Vương quốc Anh. Trên mặt trận mã nguồn mở, sáng kiến "Patch the Planet"—hợp tác với Trail of Bits và HackerOne—đang thực hiện các dự án quan trọng như cURL, Go và Python để bảo mật nền tảng của internet.

Các Điểm chính cần Lưu ý

  • Điểm đánh giá vượt trội: GPT-5.5-Cyber dẫn đầu các bài kiểm tra quan trọng của ngành như CyberGym và ExploitGym, vượt qua cả Mythos của Anthropic và các mô hình GPT-5 tiêu chuẩn.
  • Tự động hóa đầu cuối: Plugin Codex Security tự động hóa quá trình chuyển đổi từ phát hiện lỗ hổng sang tạo bản vá, hỗ trợ quét sâu và phân tích đường dẫn tấn công.
  • Chỉ truy cập sau khi kiểm duyệt: Để giảm thiểu rủi ro, mô hình GPT-5.5-Cyber có quyền hạn cao được giới hạn cho các chuyên gia phòng thủ đã được xác minh dưới sự giám sát và các rào chắn (guardrails) nghiêm ngặt.