OpenAI חושפת את GPT-5.5-Cyber כדי לחולל מהפכה בתיקון חולשות אוטומטי
OpenAI מגבירה משמעותית את מרוץ החימוש בבינה מלאכותית בתחום אבטחת הסייבר עם השקה מלאה של GPT-5.5-Cyber, מודל ייעודי שנועד להציג ביצועים גבוהים יותר מכל המדדים הקיימים בתעשייה. על ידי מעבר מעבר לזיהוי חולשות פשוט ליצירת תיקונים (patches) אוטומטיים, OpenAI שואפת לגשר על הפער הקריטי שבין איתור פגמים לבין תיקונם.
הצלחה במדדי ביצוע: GPT-5.5-Cyber מול Mythos
השקת GPT-5.5-Cyber מהווה אבן דרך משמעותית בביצועי מודלי שפה גדולים (LLM) ייעודיים. לפי OpenAI, המודל החדש קובע שיאים חדשים במדדי אבטחה קריטיים, ומתחרה במיוחד ב-Mythos 5 של Anthropic. במדד CyberGym, המודד את יכולתו של סוכן לשחזר פגמים ידועים, השיג GPT-5.5-Cyber ציון של 85.6%, ועקף את ה-83.8% של Mythos 5 ואת ה-81.8% של GPT-5 הסטנדרטי.
מרשים אף יותר היא הביצועים ב-ExploitGym, שם הגיע GPT-5.5-Cyber ל-39.5%, כמעט כפול מה-25.95% שנרשמו על ידי מודל ה-GPT-5 הבסיסי. במדד SEC-bench Pro, המעריך גילוי חולשות לטווח ארוך, המודל קיבל ציון של 69.8%, תוך שמירה על יתרון משמעותי על Claude Opus 4 (73.1% ב-CyberGym) ועל גרסאות קודמות. מספרים אלו מצביעים על כך ש-GPT-5.5-Cyber עבר כוונון עדין (fine-tuned) ספציפי עבור הלוגיקה המורכבת הנדרשת במחקר אבטחה התקפי והגנתי.
סגירת המעגל עם Codex Security
מרכיב מרכזי ביוזמת אבטחת הסייבר Daybreak הוא התוסף (plugin) המעודכן Codex Security. בעוד שכלים רבים מתמקדים אך ורק בסריקה, ה-Codex Security המעודכן מנהל את כל שרשרת התהליכים (pipeline) – מגילוי ועד ליצירת התיקון. מאז גרסת ה-research preview במרץ, התוסף סרק למעלה מ-30 מיליון commits ב-30,000 מאגרי קוד (codebases), מה שהוביל ל-500,000 תיקונים שסומנו באופן אוטומטי.
התוסף מתפקד כמהנדס אבטחה וירטואלי, מבצע סריקות עומק של מאגרי קוד שלמים, מנתח נתיבי תקיפה ובודק האם הקוד הפגיע אכן נגיש (reachable). באופן קריטי, הוא תומך בתהליכי עבודה מודרניים של מפתחים על ידי ייצוא ממצאים באמצעות קובצי SARIF או שאילתות CodeQL. כדי למנוע תיקוני אבטחה "הזויים" (hallucinated), OpenAI מדגישה כי מהנדסים אנושיים חייבים עדיין לאשר כל שינוי.
מערכת אקולוגית של הגנה גלובלית
OpenAI אינה בונה זאת בבידוד; היא בונה רשת שותפים עצומה באמצעות תוכנית השותפים Daybreak Cyber Partner Program. התוכנית כוללת ענקיות תעשייה כגון CrowdStrike, Cisco, Cloudflare, Palo Alto Networks, IBM ו-SentinelOne. חברות אלו יכולות לשלב את GPT-5.5 עם "Trusted Access for Cyber" ישירות במוצרי האבטחה הקנייניים שלהן.
יתרה מכך, היוזמה משתרעת גם על המגזר הציבורי ועל היציבות של קוד פתוח. OpenAI כוננה שותפויות Trusted Access עם ממשלות, בהן אוסטרליה, קנדה, צרפת, גרמניה, יפן והממלכה המאוחדת. בחזית הקוד הפתוח, יוזמת "Patch the Planet" – בשיתוף עם Trail of Bits ו-HackerOne – כבר עובדת על פרויקטים קריטיים כמו cURL, Go ו-Python כדי לאבטח את התשתית של האינטרנט.
נקודות מרכזיות
- מדדי ביצוע עדיפים: GPT-5.5-Cyber מוביל במבחני תעשייה מרכזיים כמו CyberGym ו-ExploitGym, ומציג ביצועים גבוהים יותר הן מ-Mythos של Anthropic והן ממודלי GPT-5 הסטנדרטיים.
- אוטומציה מקצה לקצה: התוסף Codex Security מבצע אוטומציה למעבר מגילוי חולשות ליצירת תיקונים, תוך תמיכה בסריקות עומק ובניתוח נתיבי תקיפה.
- גישה מאושרת בלבד: כדי לצמצם סיכונים, המודל בעל ההרשאות הרחבות GPT-5.5-Cyber מוגבל למגיני סייבר מאומתים תחת ניטור ומנגנוני הגנה (guardrails) קפדניים.
