Anthropic قابلیت نظارت مخفیانه را در Claude Code لغو کرد

Anthropic پس از کشف یک مکانیسم نظارتی پنهان در ابزار Claude Code خود که برای شناسایی کاربران چینی طراحی شده بود، با بررسی‌های شدیدی روبرو شده است. این افشاگری بحث‌های گسترده‌ای را در مورد حریم خصوصی کاربران، خطرات خروج داده‌ها و مرزهای اخلاقی محافظت از مدل‌ها برانگیخته است.

مکانیسم‌های شناسایی پنهان

این جنجال زمانی بالا گرفت که یکی از کاربران ردیت به نام LegitMichel777 فاش کرد که نسخه 2.1.91 از Claude Code — که در ۲ آوریل ۲۰۲۶ منتشر شده بود — حاوی کدهای مستند نشده‌ای برای علامت‌گذاری کاربران در چین است. برخلاف تلمتری (telemetry) استاندارد، این قابلیت از شکل پیچیده‌ای از استگانوگرافی (steganography) برای انتقال داده‌ها از طریق تغییرات «به‌سختی قابل تشخیص» در سیستم پرامپت (system prompt) استفاده می‌کرد.

این نرم‌افزار به‌گونه‌ای طراحی شده بود که منطقه زمانی سیستم را با "Asia/Shanghai" یا "Asia/Urumqi" مقایسه کند و آدرس‌های URL پروکسی را برای یافتن دامنه‌های چینی یا اتصال به آزمایشگاه‌های هوش مصنوعی چین اسکن کند. به محض یافتن مورد مشابه، ابزار با تغییر جزئی در فرمت تاریخ یا جایگزینی یک علامت آپاستروف استاندارد با کاراکتری متفاوت در عبارت "Today's date is"، خروجی را تغییر می‌داد. اگرچه این تغییرات برای چشم انسان نامرئی بودند، اما این ریزتنظیمات به Anthropic اجازه می‌داد تا منشأ کاربر را فوراً شناسایی کند. گزارش شده است که برای پنهان کردن بیشتر این فعالیت، کد با استفاده از رمزنگاری XOR با کلید ۹۱ مبهم‌سازی (obfuscated) شده بود تا از نمایش آن در تخلیه متن‌های استاندارد (text dumps) جلوگیری شود.

خطرات امنیتی و نقض حریم خصوصی

این کشف باعث ایجاد هشدارهای جدی در میان جامعه توسعه‌دهندگان شده است. از آنجایی که Claude Code با دسترسی کامل به سیستم فایل (filesystem) و شل (shell) فعالیت می‌کند، منتقدان استدلال می‌کنند که هرگونه کانال ارتباطی مخفی می‌تواند پتانسیل سوءاستفاده برای اشکال شدیدتر، از جمله کنترل از راه دور یا خروج غیرمجاز داده‌ها را داشته باشد.

فراتر از پیامدهای امنیتی فنی، این کشف به عنوان نقض اساسی اعتماد کاربر نگریسته می‌شود. این قابلیت بدون هیچ اشاره‌ای در یادداشت‌های انتشار رسمی (release notes) پیاده‌سازی شده بود و توسعه‌دهندگان را از این موضوع بی‌خبر گذاشته بود که داده‌های پروکسی و تنظیمات سیستم آن‌ها برای دور زدن محدودیت‌های منطقه‌ای در حال تحلیل است.

دفاع Anthropic: محافظت در برابر تقطیر مدل (Model Distillation)

در پاسخ به واکنش‌های تند، Thariq Shihipar، یکی از کارکنان Anthropic، توضیح داد که این قابلیت یک «آزمایش» بوده که در ماه مارس راه‌اندازی شده است. هدف اصلی، جلوگیری از سوءاستفاده از حساب‌ها توسط فروشندگان غیرمجاز و محافظت در برابر «تقطیر» (distillation) بود؛ فرآیندی که در آن رقبا از خروجی‌های مدل برای آموزش مدل‌های زبانی بزرگ (LLM) خود استفاده می‌کنند.

Anthropic سابقه‌ای از تنش با شرکت‌های هوش مصنوعی چینی دارد و پیش از این شرکت‌هایی مانند DeepSeek، Moonshot AI، MiniMax و Alibaba را به استفاده بدون اجازه از خروجی‌های Claude متهم کرده بود. از آنجایی که Anthropic به دلایل امنیت ملی مدل‌های خود را به‌طور رسمی در چین ارائه نمی‌دهد، شناسایی کاربرانی که از طریق کارت‌های اعتباری و شماره تلفن‌های خارجی به سرویس دسترسی پیدا می‌کنند، راهی برای محافظت از هوش اختصاصی (proprietary intelligence) تلقی می‌شد. با این حال، در پی اعتراضات، Anthropic تأیید کرد که یک pull request را برای لغو کامل این قابلیت ادغام (merge) کرده است.

نکات کلیدی

  • شناسایی استگانوگرافیک: Claude Code از جایگزینی ظریف کاراکترها در سیستم پرامپت‌ها و رمزنگاری XOR برای شناسایی مخفیانه کاربرانی که از چین متصل می‌شدند، استفاده می‌کرد.
  • نگرانی‌های امنیتی: قابلیت اجرای بررسی‌های مخفیانه در ابزاری با دسترسی کامل به سیستم فایل، ترس‌های قابل توجهی را در مورد خروج داده‌ها و حریم خصوصی کاربران ایجاد می‌کند.
  • محافظت از مدل در مقابل حریم خصوصی: Anthropic از این اقدام به عنوان آزمایشی برای جلوگیری از تقطیر مدل توسط آزمایشگاه‌های هوش مصنوعی چین دفاع کرد، اما از آن زمان متعهد به لغو کامل آن شده است.