三个词

一位研究人员在 Anthropic 最强大的 AI 模型中输入了三个词:fix this code。

在 90 分钟内,美国政府关闭了该模型。

该漏洞是一个简单的提示词(prompt)。它并非复杂的攻击。该模型提供了其安全系统本应拦截的网络安全数据。

美国商务部利用出口管制权限停止了该模型。他们命令 Anthropic 禁止所有外国公民访问该模型。这甚至包括 Anthropic 自身的部分工程师。为了避免排除自家员工,Anthropic 将模型下线。

官方理由是国家安全。但故事背后还有更深层的内幕。

Amazon 发现了这一绕过机制。Amazon 首席执行官 Andy Jassy 将此事告知了政府官员。

Amazon 是 Anthropic 的巨额投资者。Amazon 还为 Anthropic 提供其使用的云基础设施。最重要的是,Amazon 自己的 AI 产品与 Anthropic 存在竞争关系。

这一发现从竞争对手直接传到了政府手中,绕过了构建该模型的公司本身。

这一事件揭示了三个关键点:

AI 公司原以为要么会进行自我监管,要么会面临政府政策。但他们并未预料到第三种选择。

他们没有预料到,监管会通过企业情报触发的突发干预来实现。

安全研究人员希望为 AI 建立护栏。但他们没意识到,最终构建这些护栏的会是谁。

Source: https://dev.to/thesythesis/the-three-words-3ijl

Optional learning community: https://t.me/GyaanSetuAi