Anthropic, Claude Code의 은밀한 감시 기능 철회
Anthropic은 중국 사용자를 식별하기 위해 설계된 Claude Code 도구 내에서 숨겨진 감시 메커니즘이 발견됨에 따라 거센 비판에 직면해 있습니다. 이번 폭로는 사용자 개인정보 보호, 데이터 유출 위험, 그리고 모델 보호의 윤리적 경계에 관한 대규모 논쟁을 불러일으켰습니다.
스텔스 탐지 메커니즘
Reddit 사용자 LegitMichel777가 2026년 4월 2일에 출시된 Claude Code 버전 2.1.91에 중국 사용자를 표시하기 위한 문서화되지 않은 코드가 포함되어 있음을 폭로하면서 논란이 촉발되었습니다. 표준 텔레메트리(telemetry)와 달리, 이 기능은 시스템 프롬프트의 "거의 인지할 수 없는" 변화를 통해 데이터를 전송하는 정교한 형태의 스테가노그래피(steganography)를 활용했습니다.
이 소프트웨어는 시스템 시간대를 "Asia/Shanghai" 또는 "Asia/Urumqi"와 비교하고, 프록시 URL을 스캔하여 중국 도메인이나 중국 AI 연구소와의 연결 여부를 확인하도록 설계되었습니다. 일치하는 항목이 발견되면, 도구는 날짜 형식을 미세하게 조정하거나 "Today's date is"라는 문구에서 표준 아포스트로피를 다른 문자로 교체하는 방식으로 출력을 미묘하게 변경했습니다. 인간의 눈에는 보이지 않지만, 이러한 미세 조정(micro-adjustments)을 통해 Anthropic은 사용자의 출처를 즉시 식별할 수 있었습니다. 이러한 활동을 더욱 숨기기 위해, 해당 코드는 키 값이 91인 XOR 암호화를 사용하여 난독화되었으며, 이로 인해 표준 텍스트 덤프에서 나타나지 않도록 조치된 것으로 알려졌습니다.
보안 위험 및 개인정보 침해
이번 발견은 개발자 커뮤니티에 큰 경종을 울렸습니다. Claude Code는 파일 시스템 및 셸(shell)에 대한 전체 액세스 권한을 가지고 작동하기 때문에, 비판론자들은 어떠한 은밀한 통신 채널이라도 원격 제어나 무단 데이터 유출을 포함한 더 심각한 형태의 남용에 악용될 가능성이 있다고 주장합니다.
기술적인 보안 측면을 넘어, 이번 발견은 사용자 신뢰에 대한 근본적인 침해로 간주됩니다. 해당 기능은 공식 릴리스 노트에 아무런 언급 없이 구현되었으며, 이로 인해 개발자들은 지역 제한을 우회하기 위해 자신들의 프록시 데이터와 시스템 설정이 분석되고 있다는 사실을 인지하지 못했습니다.
Anthropic의 방어: 모델 증류(Model Distillation) 방지
반발에 대응하여, Anthropic의 직원 Thariq Shihipar는 해당 기능이 3월에 시작된 "실험"이었다고 해명했습니다. 주요 목적은 무단 리셀러에 의한 계정 남용을 방지하고, 경쟁사가 모델의 출력을 사용하여 자체 LLM을 학습시키는 과정인 "증류(distillation)"로부터 모델을 보호하는 것이었습니다.
Anthropic은 중국 AI 기업들과 갈등을 빚어온 역사가 있으며, 이전에도 DeepSeek, Moonshot AI, MiniMax, Alibaba와 같은 기업들이 Claude의 출력을 무단으로 사용하고 있다고 비난한 바 있습니다. Anthropic은 국가 안보상의 이유로 중국에서 공식적으로 모델을 제공하지 않기 때문에, 외국 신용카드와 전화번호를 통해 서비스에 접속하는 사용자를 식별하는 것을 독점적 지능(proprietary intelligence)을 보호하는 방법으로 간주했습니다. 그러나 거센 항의가 이어지자, Anthropic은 해당 기능을 완전히 철회하기 위해 풀 리퀘스트(pull request)를 병합했음을 확인했습니다.
핵심 요약
- 스테가노그래피 탐지: Claude Code는 중국에서 접속하는 사용자를 비밀리에 식별하기 위해 시스템 프롬프트 내의 미묘한 문자 교체와 XOR 암호화를 사용했습니다.
- 보안 우려: 파일 시스템 전체에 대한 액세스 권한을 가진 도구에서 은밀한 점검을 수행할 수 있는 능력은 데이터 유출 및 사용자 개인정보 보호에 대한 심각한 공포를 불러일으킵니다.
- 모델 보호 vs. 개인정보 보호: Anthropic은 이번 조치를 중국 AI 연구소의 모델 증류를 방지하기 위한 실험이라고 방어했으나, 이후 기능을 완전히 철회하기로 약속했습니다.
