מומחי אבטחת סייבר מוחים על האיסור האמריקאי על מודלי Fable ו-Mythos של Anthropic

📅4 hours ago⏱3 min read

In this article

מומחי סייבר מוחים על האיסור האמריקאי על מודלי Fable ו-Mythos של Anthropic

קואליציה של 76 וותיקי אבטחת סייבר מובילים מקימה קול מחאה נגד צו בקרת הייצוא האחרון של ממשל ארה"ב, המכוון למודלי ה-AI המתקדמים ביותר של Anthropic. הקבוצה טוענת כי על ידי הגבלת הגישה לכלים אלו, הממשלה מנטרלת בטעות את המגינים הדיגיטליים, בעוד שהיריבים ממשיכים להתקדם.

הקונפליקט: ביטחון לאומי מול יכולת הגנה

המתח החל כאשר ממשל ארה"ב הוציא צו בקרת ייצוא על מודלי Fable ו-Mythos של Anthropic, תוך ציון חששות לביטחון לאומי שלא פורטו. בהתאם לצו, Anthropic השעתה את הגישה העולמית למודלים אלו.

מודל Mythos תוכנן במקור עם יכולות ברמה גבוהה כל כך לגילוי פגיעויות, עד ש-Anthropic הגבילה בתחילה את הגישה לקבוצה נבחרת של כ-150 ארגונים ב-15 מדינות. הגרסה המיועדת לציבור, Fable, נועדה לכלול מנגנוני הגנה (guardrails) קשיחים כדי למנוע שימוש לרעה בתחומי הביולוגיה, הכימיה והסייבר. עם זאת, ההתערבות הממשלתית עצרה למעשה את הפריסה של הכלים העוצמתיים הללו עבור אותם אנשים שתפקידם לאבטח את האינטרנט.

מחלוקת ה-"Jailbreak" ומאמר אמזון

Anthropic מצביעה על כך שהצו של הבית הלבן עשוי לנבוע מחששות בנוגע ל-"jailbreaking" — שיטות המשמשות לעקיפת מנגנוני הגנה בטיחותיים. חשש זה מקורו, על פי הדיווחים, במאמר מחקר לא פומבי של חוקרים מאמזון.

המאמר הציע כי משתמשים יוכלו לעקוף את מגבלות האבטחה של Fable כדי להגיע ליכולות ברמת Mythos. עם זאת, מומחי סייבר, בהם Katie Moussouris (מייסדת Luta Security), טוענים כי מדובר באי-הבנה יסודית של התועלת של בינה מלאכותית. Moussouris טוענת כי ה-"jailbreak" שתואר היה פשוט ביצוע התפקוד המיועד של המודל: תיקון קוד קוד פתוח המכיל פגיעויות ידועות.

לדברי Moussouris, לבקש מבינה מלאכותית לתקן באג, להסביר את התיקון (patch) ולכתוב בדיקה, אינו מהווה פרצת אבטחה; זהו "לולאת הגילוי, התיקון והבדיקה" (find, fix, and test loop) המגדירה את אבטחת ההגנה המודרנית. ניסיון לחסום התנהגויות אלו יפגע באופן יסודי ביכולתו של המודל להגן על תוכנה.

חותמים בעלי השפעה והשלכות על התעשייה

The open letter is backed by heavyweights in the security community, including former Facebook security chief Alex Stamos, Bugcrowd founder Casey Ellis, and famed cryptographer Jon Callas. Their argument is centered on a critical imbalance: if defenders are denied access to cutting-edge LLMs while adversaries utilize unrestricted models, the global security posture weakens.

The experts also pointed out that the perceived vulnerability in Fable is not unique to Anthropic. The letter suggests that similar "vulnerabilities" could be replicated on OpenAI’s GPT-5.5, Anthropic’s own Claude Opus 4.8 and Sonnet, and even international models like Kimi 2.7.

The group is calling for a democratic, science-based regulatory process that relies on transparent research rather than broad, reactionary bans that may do more harm than good.

Key Takeaways

Defensive Disarmament: Cybersecurity experts warn that banning Anthropic’s Fable and Mythos models strips defenders of essential tools needed to find and fix software vulnerabilities.
Functionality vs. Security: Critics argue that the "jailbreaking" concerns raised by researchers confuse legitimate defensive coding tasks with malicious exploits.
Call for Transparency: Industry leaders are demanding a scientific, democratic rule-making process for AI export controls to ensure regulations are targeted and effective.

מומחי אבטחת סייבר מוחים על האיסור האמריקאי על מודלי Fable ו-Mythos של Anthropic

מומחי סייבר מוחים על האיסור האמריקאי על מודלי Fable ו-Mythos של Anthropic

הקונפליקט: ביטחון לאומי מול יכולת הגנה

מחלוקת ה-"Jailbreak" ומאמר אמזון

חותמים בעלי השפעה והשלכות על התעשייה

Key Takeaways

Continue reading

𝗚𝗲𝗻𝗲𝘁𝗶𝗰 𝗗𝗶𝘃𝗲𝗿𝘀𝗶𝘁𝘆 𝗮𝗻𝗱 𝗖𝘆𝗯𝗲𝗿 𝗗𝗶𝘃𝗲𝗿𝘀𝗶𝘁𝘆

𝗧𝗵𝗲 𝗨𝗦 𝗚𝗼𝘃𝗲𝗿𝗻𝗺𝗲𝗻𝘁 𝗥𝗲𝗰𝗮𝗹𝗹𝗲𝗱 𝗔𝗻 𝗔𝗜 𝗠𝗼𝗱𝗲𝗹

𝗖𝗹𝗮𝘂𝗱𝗲 𝗙𝗮𝗯𝗹𝗲 𝟱 𝗦𝗵𝘂𝘁𝗱𝗼𝘄𝗻: 𝗪𝗵𝗮𝘁 𝗗𝗲𝘃𝗲𝗹𝗼𝗽𝗲𝗿𝘀 𝗡𝗲𝗲𝗱 𝘁𝗼 𝗞𝗻𝗼𝘄

US Government vs Anthropic: The Impossible Demand for Unhackable LLMs

כיצד השבתת Anthropic הזינה את המאמץ העולמי לבינה מלאכותית ריבונית