Anthropic Menarik Balik Ciri Pengawasan Sulit dalam Claude Code
Anthropic sedang menghadapi penelitian hebat susulan penemuan mekanisme pengawasan tersembunyi dalam alat Claude Code miliknya yang direka untuk mengenal pasti pengguna dari China. Pendedahan ini telah mencetuskan perdebatan besar mengenai privasi pengguna, risiko eksfiltrasi data, dan sempadan etika perlindungan model.
Mekanisme Pengesanan Halus
Kontroversi ini meletus apabila seorang pengguna Reddit, LegitMichel777, mendedahkan bahawa Claude Code versi 2.1.91—yang dikeluarkan pada 2 April 2026—mengandungi kod tidak didokumentasikan untuk menandakan pengguna di China. Berbeza dengan telemetri standard, ciri ini menggunakan bentuk steganografi yang canggih untuk menghantar data melalui perubahan yang "hampir tidak dapat dikesan" dalam arahan sistem (system prompt).
Perisian tersebut direka untuk membandingkan zon masa sistem dengan "Asia/Shanghai" atau "Asia/Urumqi" dan mengimbas URL proksi untuk domain China atau sambungan ke makmal AI China. Sebaik sahaja padanan ditemui, alat tersebut akan mengubah output secara halus dengan mengubah suai format tarikh atau menukar tanda apostrof standard kepada aksara yang berbeza dalam frasa "Today's date is." Walaupun tidak kelihatan pada mata kasar, pelarasan mikro ini membolehkan Anthropic mengenal pasti asal usul pengguna dengan serta-merta. Untuk menyembunyikan aktiviti ini dengan lebih lanjut, kod tersebut dilaporkan telah dikaburkan menggunakan penyulitan XOR dengan kunci 91, bagi menghalangnya daripada muncul dalam pembuangan teks (text dumps) standard.
Risiko Keselamatan dan Pelanggaran Privasi
Penemuan ini telah menimbulkan kebimbangan besar dalam kalangan komuniti pembangun. Oleh kerana Claude Code beroperasi dengan akses sistem fail dan shell sepenuhnya, pengkritik berhujah bahawa sebarang saluran komunikasi sulit berpotensi dieksploitasi untuk bentuk penyalahgunaan yang lebih teruk, termasuk kawalan jauh atau eksfiltrasi data tanpa kebenaran.
Selain implikasi keselamatan teknikal, penemuan ini dilihat sebagai pelanggaran asas terhadap kepercayaan pengguna. Ciri tersebut dilaksanakan tanpa sebarang sebutan dalam nota keluaran rasmi, menyebabkan pembangun tidak menyedari bahawa data proksi dan tetapan sistem mereka sedang dianalisis untuk memintas sekatan wilayah.
Pembelaan Anthropic: Melindungi Daripada Distilasi Model
Sebagai tindak balas terhadap kecaman tersebut, pekerja Anthropic, Thariq Shihipar, menjelaskan bahawa ciri tersebut merupakan satu "eksperimen" yang dilancarkan pada bulan Mac. Objektif utamanya adalah untuk menghalang penyalahgunaan akaun oleh penjual semula tanpa kebenaran dan untuk melindungi daripada "distilasi" (distillation)—iaitu proses di mana pesaing menggunakan output model untuk melatih LLM mereka sendiri.
Anthropic mempunyai sejarah ketegangan dengan firma AI China, di mana sebelum ini mereka menuduh syarikat seperti DeepSeek, Moonshot AI, MiniMax, dan Alibaba menggunakan output Claude tanpa kebenaran. Memandangkan Anthropic tidak menawarkan modelnya secara rasmi di China atas sebab keselamatan negara, mengenal pasti pengguna yang mengakses perkhidmatan melalui kad kredit dan nombor telefon asing dilihat sebagai cara untuk melindungi kecerdasan proprietari. Walau bagaimanapun, susulan bantahan tersebut, Anthropic mengesahkan bahawa mereka telah menggabungkan satu permintaan tarik (pull request) untuk menarik balik ciri tersebut sepenuhnya.
Ringkasan Utama
- Pengesanan Steganografi: Claude Code menggunakan pertukaran aksara yang halus dalam arahan sistem dan penyulitan XOR untuk mengenal pasti pengguna yang menyambung dari China secara rahsia.
- Kebimbangan Keselamatan: Keupayaan untuk menjalankan semakan sulit dalam alat dengan akses sistem fail sepenuhnya menimbulkan ketakutan besar mengenai eksfiltrasi data dan privasi pengguna.
- Perlindungan Model lwn Privasi: Anthropic mempertahankan langkah tersebut sebagai eksperimen untuk menghalang distilasi model oleh makmal AI China, tetapi kini telah komited untuk melakukan penarikan balik sepenuhnya.
