经过政府谈判,Anthropic 恢复 Claude Fable 5 的访问权限
经过与特朗普政府数周的密集谈判,Anthropic 已正式批准备受期待的 Claude Fable 5 模型回归。在此之前,由于严格的出口管制,这一行业内最重要的面向消费者的 AI 模型之一曾一度被迫停用。
取消出口管制并恢复全球访问
美国商务部已正式取消了此前限制 Claude Fable 5 及其底层技术 Mythos 5 访问权限的出口管制指令。这些管制措施曾造成了巨大的运营障碍,禁止外国公民(包括 Anthropic 许多国际员工以及企业客户公司的非美国成员)使用这些模型。
Anthropic 已确认,将从本周三开始在全球 Claude 平台上逐步恢复对 Fable 5 的访问。虽然尚未设定具体的时间表,但该公司计划在不久的将来在包括 AWS、Google Cloud 和 Microsoft Foundry 在内的主要云基础设施上重新启用该模型。
应对越狱漏洞
政府最初的干预是由对潜在“越狱”(jailbreaks)的担忧引发的,特别是由于亚马逊研究人员的一份报告指出了一个漏洞。作为回应,Anthropic 已实施了更强大的安全架构。
该公司训练了一个改进的安全分类器,旨在针对并拦截亚马逊报告中识别出的特定技术,并声称成功率超过 99%。为了确保在请求被拦截时用户体验依然流畅,Anthropic 集成了一种回退机制:如果对 Fable 5 的请求被新的分类器标记,它将自动路由到 Opus 4.8 模型。
政府与 AI 协作的新时代
Fable 5 的回归标志着前沿 AI 实验室与联邦监管机构互动方式的根本转变。Anthropic 已概述了一项与特朗普政府密切合作的积极战略,其中包括:
- 发布前政府访问权限: 允许政府合作伙伴在模型面向公众之前,对其涉及国家安全的相关模型进行独立评估。
- 快速信息共享: 承诺在发现重大越狱或滥用模式时立即进行披露。
- 资源分配: 组建专门团队并提供大量的算力分配,以支持政府的测试和研究。
此外,Anthropic 正通过其 Project Glasswing 项目(与 Amazon、Microsoft 和 Google 合作)领导一项全行业努力,旨在建立一套自愿性的、共享的安全与评估标准。该框架试图根据攻击者能力的提升程度、获益范围、武器化难易程度以及可发现性来对越狱严重程度进行分类。
为什么这对 AI 行业至关重要
这一进展是 AI 领域的一个分水岭时刻,尤其是考虑到像 OpenAI 这样的公司正在为 GPT-5 等模型进行类似的逐步推出。随着行业向具有先进网络安全能力、更强大的模型迈进,快速创新与国家安全之间的紧张关系只会进一步加剧。Anthropic 将“发布前测试”和“自愿标准”正式化的举措,很可能成为前沿模型提供商在高度监管的环境中维持合法性的蓝图。
核心要点
- 全球恢复: Claude Fable 5 将于本周三回归全球 Claude 平台,随后将开放云服务商(AWS、Google、Microsoft)的访问权限。
- 增强安全性: 已部署新的安全分类器,可拦截超过 99% 的已识别越狱技术,并将拦截的查询重定向至 Opus 4.8。
- 监管协同: Anthropic 正转向与美国政府的协作模式,提供发布前评估并就安全威胁进行快速信息共享。
