Anthropic מחזירה את הגישה ל-Claude Fable 5 לאחר משא ומתן עם הממשל

לאחר שבועות של משא ומתן אינטנסיבי עם ממשל טראמפ, Anthropic נתנה באופן רשמי אור ירוק להחזרתו של מודל Claude Fable 5 המצופה מאוד. מהלך זה מגיע לאחר תקופה של בקרת ייצוא מחמירה שדחקה הצידה את אחד ממודלי ה-AI המשמעותיים ביותר המיועדים לצרכן בתעשייה.

הסרת בקרת הייצוא והשבת הגישה העולמית

משרד המסחר הסיר באופן רשמי את הנחיות בקרת הייצוא שחסמו בעבר את הגישה הן ל-Claude Fable 5 והן לטכנולוגיית הבסיס שלו, Mythos 5. בקרות אלו יצרו מכשול תפעולי עצום, שכן הן אסרו על אזרחים זרים — כולל רבים מהעובדים הבינלאומיים של Anthropic עצמה וחברים שאינם אזרחי ארה"ב בחברות לקוחות ארגוניות — להשתמש במודלים.

Anthropic אישרה כי תתחיל להשיב את הגישה ל-Fable 5 ברחבי העולם בפלטפורמות Claude החל מיום רביעי הקרוב. למרות שלא נקבע לוח זמנים ספציפי, החברה מתכננת להפעיל מחדש את המודל בתשתיות ענן מרכזיות, כולל AWS, Google Cloud ו-Microsoft Foundry, בעתיד הקרוב.

התמודדות עם פגיעות ה-"Jailbreak"

ההתערבות הראשונית של הממשל נבעה מחששות מפני "jailbreaks" (פריצות למערכת) פוטנציאליים, במיוחד בעקבות דוח של חוקרים ב-Amazon שסימן פגיעות אבטחה. בתגובה, Anthropic הטמיעה ארכיטקטורת בטיחות חסונה יותר.

החברה אימנה מסווג בטיחות (safety classifier) משופר שנועד לזהות ולחסום את הטכניקות הספציפיות שזוהו בדוח של Amazon, וטענה לשיעור הצלחה של למעלה מ-99%. כדי להבטיח שחווית המשתמש תישאר רציפה גם כאשר בקשה נחסמת, Anthropic שילבה מנגנון גיבוי (fallback mechanism): אם בקשה ל-Fable 5 מסומנת על ידי המסווג החדש, היא תופנה באופן אוטומטי למודל Opus 4.8 במקום.

עידן חדש של שיתוף פעולה בין הממשל ל-AI

חזרתו של Fable 5 מסמנת שינוי יסודי באופן שבו מעבדות AI פורצות דרך (frontier AI labs) מתקשרות עם רגולטורים פדרליים. Anthropic הציגה אסטרטגיה פרואקטיבית לעבודה צמודה עם ממשל טראמפ, הכוללת:

  • גישה ממשלתית טרום-שחרור: מתן אפשרות לשותפים ממשלתיים לבצע הערכות עצמאיות על מודלים הרלוונטיים לביטחון לאומי לפני שהם מגיעים לציבור.
  • שיתוף מידע מהיר: התחייבות לחשיפה מיידית כאשר מזוהים jailbreaks משמעותיים או דפוסי שימוש לרעה.
  • הקצאת משאבים: הקמת צוותים ייעודיים ואספקת הקצאת כוח מחשוב משמעותית לתמיכה בבדיקות ומחקר ממשלתיים.

יתרה מכך, Anthropic מובילה מאמץ כלל-תעשייתי באמצעות תוכנית Project Glasswing שלה — בשיתוף פעולה עם Amazon, Microsoft ו-Google — כדי לבסס תקן אבטחה והערכה וולונטרי ומשותף. מסגרת זו שואפת לסווג את חומרת ה-jailbreak על בסיס הרווח ביכולות התוקף, היקף הרווח, קלות ההפיכה לנשק ויכולת הגילוי.

מדוע זה חשוב לתעשיית ה-AI

התפתחות זו היא רגע מכונן בנוף ה-AI, במיוחד כאשר חברות כמו OpenAI מנווטות בהשקות מדורגות דומות עבור מודלים כמו GPT-5. ככל שהתעשייה נעה לעבר מודלים חזקים יותר בעלי יכולות אבטחת סייבר מתקדמות, המתח בין חדשנות מהירה לבין ביטחון לאומי רק יתעצם. המהלך של Anthropic למיסוד "בדיקות טרום-שחרור" ו"תקנים וולונטריים" עשוי בהחלט להפוך למודל עבור הדרך שבה ספקי מודלים פורצי דרך שומרים על לגיטימיות בסביבה מוסדרת מאוד.

נקודות מרכזיות

  • השבה גלובלית: Claude Fable 5 חוזר לפלטפורמות Claude העולמיות ביום רביעי הקרוב, כאשר גישה דרך ספקי ענן (AWS, Google, Microsoft) תבוא בהמשך.
  • אבטחה משופרת: מסווג בטיחות חדש הוטמע, החוסם טכניקות jailbreak מזוהות ביותר מ-99% מהמקרים ומפנה שאילתות חסומות ל-Opus 4.8.
  • תיאום רגולטורי: Anthropic נעה לעבר מודל שיתופי עם ממשל ארה"ב, המציע הערכות טרום-שחרור ושיתוף מידע מהיר על איומי אבטחה.