Anthropic 回滚了 Claude Code 中的隐蔽监控功能
在其 Claude Code 工具中发现了一个旨在识别中国用户的隐藏监控机制后,Anthropic 正面临严厉的审查。这一发现引发了关于用户隐私、数据外泄风险以及模型保护伦理边界的巨大争议。
隐蔽检测的机制
这场争议源于 Reddit 用户 LegitMichel777 的曝光,他指出 2026 年 4 月 2 日发布的 Claude Code 2.1.91 版本包含了一段未公开的代码,用于标记中国用户。与标准的遥测技术不同,该功能利用了一种复杂的隐写术(steganography),通过系统提示词(system prompt)中“几乎察觉不到”的变化来传输数据。
该软件旨在将系统时区与“Asia/Shanghai”或“Asia/Urumqi”进行比对,并扫描代理 URL 是否包含中国域名或与中国 AI 实验室的连接。一旦发现匹配项,该工具就会通过微调日期格式,或在“Today's date is”短语中将标准撇号替换为不同的字符,从而微妙地改变输出内容。虽然肉眼无法察觉,但这些微小的调整让 Anthropic 能够瞬间识别用户的来源。据报道,为了进一步隐藏此类活动,代码使用了密钥为 91 的 XOR 加密进行了混淆,从而防止其出现在标准的文本转储(text dumps)中。
安全风险与隐私侵犯
这一发现引起了开发者社区的高度警觉。由于 Claude Code 拥有完整的系统文件和 Shell 访问权限,批评人士认为,任何隐蔽的通信渠道都可能被利用于更严重的滥用行为,包括远程控制或未经授权的数据外泄。
除了技术安全层面的影响外,这一发现也被视为对用户信任的根本性违背。该功能在实施时并未在官方发布说明中提及,导致开发者在不知情的情况下,其代理数据和系统设置被用于分析以规避地区限制。
Anthropic 的辩护:防止模型蒸馏
针对舆论的抨击,Anthropic 员工 Thariq Shihipar 澄清称,该功能是 3 月份启动的一项“实验”。其主要目标是防止未经授权的转售商滥用账户,并防御“蒸馏”(distillation)——即竞争对手利用模型输出结果来训练其自有 LLM 的过程。
Anthropic 与中国 AI 公司之间一直存在紧张关系,此前曾指责 DeepSeek、Moonshot AI、MiniMax 和阿里巴巴等公司未经许可使用 Claude 的输出内容。由于出于国家安全原因,Anthropic 并未在中国正式提供其模型,因此,识别那些通过外国信用卡和电话号码访问服务的用户,被视为保护其专有智能的一种手段。然而,在引发强烈抗议后,Anthropic 确认已合并了一个拉取请求(pull request),以完全回滚该功能。
核心要点
- 隐写检测: Claude Code 通过在系统提示词中进行微妙的字符替换并使用 XOR 加密,来秘密识别来自中国的连接用户。
- 安全担忧: 在一个拥有完整文件系统访问权限的工具中运行隐蔽检查的能力,引发了人们对数据外泄和用户隐私的严重担忧。
- 模型保护与隐私的权衡: Anthropic 为此辩解称这是一项旨在防止中国 AI 实验室进行模型蒸馏的实验,但随后已承诺完全回滚该功能。
