Anthropic Menarik Kembali Fitur Pengawasan Terselubung dalam Claude Code

Anthropic tengah menghadapi pengawasan ketat menyusul ditemukannya mekanisme pengawasan tersembunyi di dalam alat Claude Code miliknya yang dirancang untuk mengidentifikasi pengguna asal Tiongkok. Pengungkapan ini telah memicu perdebatan besar mengenai privasi pengguna, risiko eksfiltrasi data, dan batasan etika dalam perlindungan model.

Mekanisme Deteksi Tersembunyi

Kontroversi ini meledak ketika seorang pengguna Reddit, LegitMichel777, mengungkap bahwa Claude Code versi 2.1.91—yang dirilis pada 2 April 2026—berisi kode yang tidak terdokumentasi untuk menandai pengguna di Tiongkok. Berbeda dengan telemetri standar, fitur ini menggunakan bentuk steganografi yang canggih untuk mengirimkan data melalui perubahan yang "nyaris tidak terlihat" pada system prompt.

Perangkat lunak tersebut dirancang untuk membandingkan zona waktu sistem dengan "Asia/Shanghai" atau "Asia/Urumqi" dan memindai URL proksi untuk mencari domain Tiongkok atau koneksi ke laboratorium AI Tiongkok. Setelah kecocokan ditemukan, alat tersebut akan mengubah output secara halus dengan memodifikasi format tanggal atau mengganti tanda kutip standar dengan karakter yang berbeda dalam frasa "Today's date is." Meskipun tidak terlihat oleh mata manusia, penyesuaian mikro ini memungkinkan Anthropic untuk mengidentifikasi asal pengguna secara instan. Untuk semakin menyembunyikan aktivitas ini, kode tersebut dilaporkan dikaburkan (obfuscated) menggunakan enkripsi XOR dengan kunci 91, sehingga mencegahnya muncul dalam tumpukan teks (text dumps) standar.

Risiko Keamanan dan Pelanggaran Privasi

Penemuan ini telah menimbulkan alarm signifikan di kalangan komunitas pengembang. Karena Claude Code beroperasi dengan akses penuh ke sistem berkas (filesystem) dan shell, para kritikus berpendapat bahwa saluran komunikasi terselubung apa pun berpotensi dieksploitasi untuk bentuk penyalahgunaan yang lebih parah, termasuk kendali jarak jauh atau eksfiltrasi data tanpa izin.

Di luar implikasi keamanan teknis, penemuan ini dipandang sebagai pelanggaran mendasar terhadap kepercayaan pengguna. Fitur tersebut diimplementasikan tanpa penyebutan apa pun dalam catatan rilis resmi, sehingga membuat pengembang tidak menyadari bahwa data proksi dan pengaturan sistem mereka sedang dianalisis untuk menyiasati pembatasan regional.

Pembelaan Anthropic: Melindungi dari Distilasi Model

Menanggapi reaksi keras tersebut, karyawan Anthropic Thariq Shihipar mengklarifikasi bahwa fitur tersebut adalah sebuah "eksperimen" yang diluncurkan pada bulan Maret. Tujuan utamanya adalah untuk mencegah penyalahgunaan akun oleh penjual tidak resmi dan untuk melindungi dari "distilasi"—proses di mana kompetitor menggunakan output model untuk melatih LLM mereka sendiri.

Anthropic memiliki sejarah ketegangan dengan perusahaan AI Tiongkok, sebelumnya menuduh perusahaan seperti DeepSeek, Moonshot AI, MiniMax, dan Alibaba menggunakan output Claude tanpa izin. Karena Anthropic tidak secara resmi menawarkan modelnya di Tiongkok karena alasan keamanan nasional, mengidentifikasi pengguna yang mengakses layanan melalui kartu kredit dan nomor telepon asing dipandang sebagai cara untuk melindungi intelijen milik perusahaan. Namun, menyusul protes keras, Anthropic mengonfirmasi bahwa mereka telah menggabungkan (merge) sebuah pull request untuk menarik kembali fitur tersebut sepenuhnya.

Poin-Poin Penting

  • Deteksi Steganografi: Claude Code menggunakan pertukaran karakter halus dalam system prompt dan enkripsi XOR untuk secara rahasia mengidentifikasi pengguna yang terhubung dari Tiongkok.
  • Kekhawatiran Keamanan: Kemampuan untuk menjalankan pemeriksaan terselubung dalam alat dengan akses sistem berkas penuh menimbulkan ketakutan signifikan terkait eksfiltrasi data dan privasi pengguna.
  • Perlindungan Model vs. Privasi: Anthropic membela langkah tersebut sebagai eksperimen untuk mencegah distilasi model oleh laboratorium AI Tiongkok, namun sejak saat itu telah berkomitmen untuk melakukan penarikan kembali secara penuh.