网络安全专家抗议美国禁止 Anthropic 的 Fable 和 Mythos 模型

由 76 位顶尖网络安全资深人士组成的联盟,正针对美国政府近期针对 Anthropic 最先进 AI 模型发布的出口管制令发出警告。该团体认为,通过限制对这些工具的使用,政府在对手不断进步的同时,无意中削弱了数字防御者的能力。

冲突:国家安全 vs. 防御能力

紧张局势始于美国政府以未公开的国家安全担忧为由,对 Anthropic 的 FableMythos 模型发布了出口管制令。为了遵守该命令,Anthropic 已暂停了全球范围内对这些模型的访问。

Mythos 模型最初被设计用于极高水平的漏洞发现,因此 Anthropic 最初仅向分布在 15 个国家的约 150 家选定组织开放了访问权限。面向公众的版本 Fable 原本旨在包含严格的防护栏,以防止在生物学、化学和网络安全领域的滥用。然而,政府的干预实际上阻碍了这些强大工具在负责保障互联网安全的人员手中的部署。

“越狱”争议与亚马逊论文

Anthropic 表示,白宫的命令可能源于对“越狱”(jailbreaking)——即用于绕过安全防护栏的方法——的担忧。据报道,这种担忧源于亚马逊研究人员的一篇非公开研究论文。

该论文指出,用户可以通过绕过 Fable 的安全限制来获取 Mythos 级别的能力。然而,包括 Katie Moussouris(Luta Security 创始人)在内的网络安全专家认为,这是对 AI 用途的根本性误解。Moussouris 主张,论文中所描述的“越狱”仅仅是模型在执行其预定功能:修复包含已知漏洞的开源代码。

根据 Moussouris 的说法,要求 AI 修复漏洞、解释补丁并编写测试,这并不构成安全违规;相反,它是定义现代防御性安全的“发现、修复与测试循环”(find, fix, and test loop)。试图阻止这些行为将从根本上削弱模型保护软件的能力。

高规格签署人与行业影响

这封公开信得到了安全领域重量级人物的支持,包括 Facebook 前安全主管 Alex Stamos、Bugcrowd 创始人 Casey Ellis 以及著名密码学家 Jon Callas。他们的论点集中在一个关键的不平衡点上:如果防御者被剥夺了使用尖端 LLM 的机会,而攻击者却在使用不受限制的模型,那么全球的安全态势将会削弱。

专家们还指出,在 Fable 中察觉到的漏洞并非 Anthropic 所特有。信中指出,类似的“漏洞”也可能出现在 OpenAI 的 GPT-5.5、Anthropic 自家的 Claude Opus 4.8Sonnet,甚至是像 Kimi 2.7 这样的国际模型上。

该团体呼吁建立一种民主化、基于科学的监管流程,依靠透明的研究,而不是采取可能弊大于利的广泛且反应性的禁令。

核心要点