מומחי סייבר מוחים על האיסור האמריקאי על מודלי Fable ו-Mythos של Anthropic

קואליציה של 76 וותיקי אבטחת סייבר מובילים מקימה קול מחאה נגד צו בקרת הייצוא האחרון של ממשל ארה"ב, המכוון למודלי ה-AI המתקדמים ביותר של Anthropic. הקבוצה טוענת כי על ידי הגבלת הגישה לכלים אלו, הממשלה מנטרלת בטעות את המגינים הדיגיטליים, בעוד שהיריבים ממשיכים להתקדם.

הקונפליקט: ביטחון לאומי מול יכולת הגנה

המתח החל כאשר ממשל ארה"ב הוציא צו בקרת ייצוא על מודלי Fable ו-Mythos של Anthropic, תוך ציון חששות לביטחון לאומי שלא פורטו. בהתאם לצו, Anthropic השעתה את הגישה העולמית למודלים אלו.

מודל Mythos תוכנן במקור עם יכולות ברמה גבוהה כל כך לגילוי פגיעויות, עד ש-Anthropic הגבילה בתחילה את הגישה לקבוצה נבחרת של כ-150 ארגונים ב-15 מדינות. הגרסה המיועדת לציבור, Fable, נועדה לכלול מנגנוני הגנה (guardrails) קשיחים כדי למנוע שימוש לרעה בתחומי הביולוגיה, הכימיה והסייבר. עם זאת, ההתערבות הממשלתית עצרה למעשה את הפריסה של הכלים העוצמתיים הללו עבור אותם אנשים שתפקידם לאבטח את האינטרנט.

מחלוקת ה-"Jailbreak" ומאמר אמזון

Anthropic מצביעה על כך שהצו של הבית הלבן עשוי לנבוע מחששות בנוגע ל-"jailbreaking" — שיטות המשמשות לעקיפת מנגנוני הגנה בטיחותיים. חשש זה מקורו, על פי הדיווחים, במאמר מחקר לא פומבי של חוקרים מאמזון.

המאמר הציע כי משתמשים יוכלו לעקוף את מגבלות האבטחה של Fable כדי להגיע ליכולות ברמת Mythos. עם זאת, מומחי סייבר, בהם Katie Moussouris (מייסדת Luta Security), טוענים כי מדובר באי-הבנה יסודית של התועלת של בינה מלאכותית. Moussouris טוענת כי ה-"jailbreak" שתואר היה פשוט ביצוע התפקוד המיועד של המודל: תיקון קוד קוד פתוח המכיל פגיעויות ידועות.

לדברי Moussouris, לבקש מבינה מלאכותית לתקן באג, להסביר את התיקון (patch) ולכתוב בדיקה, אינו מהווה פרצת אבטחה; זהו "לולאת הגילוי, התיקון והבדיקה" (find, fix, and test loop) המגדירה את אבטחת ההגנה המודרנית. ניסיון לחסום התנהגויות אלו יפגע באופן יסודי ביכולתו של המודל להגן על תוכנה.

חותמים בעלי השפעה והשלכות על התעשייה

The open letter is backed by heavyweights in the security community, including former Facebook security chief Alex Stamos, Bugcrowd founder Casey Ellis, and famed cryptographer Jon Callas. Their argument is centered on a critical imbalance: if defenders are denied access to cutting-edge LLMs while adversaries utilize unrestricted models, the global security posture weakens.

The experts also pointed out that the perceived vulnerability in Fable is not unique to Anthropic. The letter suggests that similar "vulnerabilities" could be replicated on OpenAI’s GPT-5.5, Anthropic’s own Claude Opus 4.8 and Sonnet, and even international models like Kimi 2.7.

The group is calling for a democratic, science-based regulatory process that relies on transparent research rather than broad, reactionary bans that may do more harm than good.

Key Takeaways