Anthropic قابلیت نظارت مخفیانه را در Claude Code لغو کرد
Anthropic پس از کشف یک مکانیسم نظارتی پنهان در ابزار Claude Code خود که برای شناسایی کاربران چینی طراحی شده بود، با بررسیهای شدیدی روبرو شده است. این افشاگری بحثهای گستردهای را در مورد حریم خصوصی کاربران، خطرات خروج دادهها و مرزهای اخلاقی محافظت از مدلها برانگیخته است.
مکانیسمهای شناسایی پنهان
این جنجال زمانی بالا گرفت که یکی از کاربران ردیت به نام LegitMichel777 فاش کرد که نسخه 2.1.91 از Claude Code — که در ۲ آوریل ۲۰۲۶ منتشر شده بود — حاوی کدهای مستند نشدهای برای علامتگذاری کاربران در چین است. برخلاف تلمتری (telemetry) استاندارد، این قابلیت از شکل پیچیدهای از استگانوگرافی (steganography) برای انتقال دادهها از طریق تغییرات «بهسختی قابل تشخیص» در سیستم پرامپت (system prompt) استفاده میکرد.
این نرمافزار بهگونهای طراحی شده بود که منطقه زمانی سیستم را با "Asia/Shanghai" یا "Asia/Urumqi" مقایسه کند و آدرسهای URL پروکسی را برای یافتن دامنههای چینی یا اتصال به آزمایشگاههای هوش مصنوعی چین اسکن کند. به محض یافتن مورد مشابه، ابزار با تغییر جزئی در فرمت تاریخ یا جایگزینی یک علامت آپاستروف استاندارد با کاراکتری متفاوت در عبارت "Today's date is"، خروجی را تغییر میداد. اگرچه این تغییرات برای چشم انسان نامرئی بودند، اما این ریزتنظیمات به Anthropic اجازه میداد تا منشأ کاربر را فوراً شناسایی کند. گزارش شده است که برای پنهان کردن بیشتر این فعالیت، کد با استفاده از رمزنگاری XOR با کلید ۹۱ مبهمسازی (obfuscated) شده بود تا از نمایش آن در تخلیه متنهای استاندارد (text dumps) جلوگیری شود.
خطرات امنیتی و نقض حریم خصوصی
این کشف باعث ایجاد هشدارهای جدی در میان جامعه توسعهدهندگان شده است. از آنجایی که Claude Code با دسترسی کامل به سیستم فایل (filesystem) و شل (shell) فعالیت میکند، منتقدان استدلال میکنند که هرگونه کانال ارتباطی مخفی میتواند پتانسیل سوءاستفاده برای اشکال شدیدتر، از جمله کنترل از راه دور یا خروج غیرمجاز دادهها را داشته باشد.
فراتر از پیامدهای امنیتی فنی، این کشف به عنوان نقض اساسی اعتماد کاربر نگریسته میشود. این قابلیت بدون هیچ اشارهای در یادداشتهای انتشار رسمی (release notes) پیادهسازی شده بود و توسعهدهندگان را از این موضوع بیخبر گذاشته بود که دادههای پروکسی و تنظیمات سیستم آنها برای دور زدن محدودیتهای منطقهای در حال تحلیل است.
دفاع Anthropic: محافظت در برابر تقطیر مدل (Model Distillation)
در پاسخ به واکنشهای تند، Thariq Shihipar، یکی از کارکنان Anthropic، توضیح داد که این قابلیت یک «آزمایش» بوده که در ماه مارس راهاندازی شده است. هدف اصلی، جلوگیری از سوءاستفاده از حسابها توسط فروشندگان غیرمجاز و محافظت در برابر «تقطیر» (distillation) بود؛ فرآیندی که در آن رقبا از خروجیهای مدل برای آموزش مدلهای زبانی بزرگ (LLM) خود استفاده میکنند.
Anthropic سابقهای از تنش با شرکتهای هوش مصنوعی چینی دارد و پیش از این شرکتهایی مانند DeepSeek، Moonshot AI، MiniMax و Alibaba را به استفاده بدون اجازه از خروجیهای Claude متهم کرده بود. از آنجایی که Anthropic به دلایل امنیت ملی مدلهای خود را بهطور رسمی در چین ارائه نمیدهد، شناسایی کاربرانی که از طریق کارتهای اعتباری و شماره تلفنهای خارجی به سرویس دسترسی پیدا میکنند، راهی برای محافظت از هوش اختصاصی (proprietary intelligence) تلقی میشد. با این حال، در پی اعتراضات، Anthropic تأیید کرد که یک pull request را برای لغو کامل این قابلیت ادغام (merge) کرده است.
نکات کلیدی
- شناسایی استگانوگرافیک: Claude Code از جایگزینی ظریف کاراکترها در سیستم پرامپتها و رمزنگاری XOR برای شناسایی مخفیانه کاربرانی که از چین متصل میشدند، استفاده میکرد.
- نگرانیهای امنیتی: قابلیت اجرای بررسیهای مخفیانه در ابزاری با دسترسی کامل به سیستم فایل، ترسهای قابل توجهی را در مورد خروج دادهها و حریم خصوصی کاربران ایجاد میکند.
- محافظت از مدل در مقابل حریم خصوصی: Anthropic از این اقدام به عنوان آزمایشی برای جلوگیری از تقطیر مدل توسط آزمایشگاههای هوش مصنوعی چین دفاع کرد، اما از آن زمان متعهد به لغو کامل آن شده است.
