Pakar Keamanan Siber Protes Larangan AS terhadap Model Fable dan Mythos milik Anthropic

Sebuah koalisi yang terdiri dari 76 veteran keamanan siber terkemuka sedang menyuarakan peringatan terhadap perintah kontrol ekspor pemerintah AS baru-baru ini yang menargetkan model AI paling canggih milik Anthropic. Kelompok tersebut berargumen bahwa dengan membatasi akses ke alat-alat ini, pemerintah secara tidak sengaja melucuti pertahanan digital sementara para lawan terus maju.

Konflik: Keamanan Nasional vs. Kemampuan Defensif

Ketegangan dimulai ketika pemerintah AS mengeluarkan perintah kontrol ekspor terhadap model Fable dan Mythos milik Anthropic, dengan alasan kekhawatiran keamanan nasional yang tidak diungkapkan. Sebagai bentuk kepatuhan terhadap perintah tersebut, Anthropic telah menangguhkan akses ke seluruh dunia terhadap model-model ini.

Model Mythos awalnya dirancang dengan kemampuan tingkat tinggi untuk penemuan kerentanan sehingga Anthropic pada awalnya membatasi akses hanya kepada kelompok terpilih yang terdiri dari sekitar 150 organisasi di 15 negara. Versi yang ditujukan untuk publik, Fable, dimaksudkan untuk menyertakan batasan (guardrails) yang ketat guna mencegah penyalahgunaan dalam bidang biologi, kimia, dan keamanan siber. Namun, intervensi pemerintah secara efektif telah menghentikan penerapan alat-alat canggih ini bagi orang-orang yang justru bertugas mengamankan internet.

Kontroversi "Jailbreak" dan Makalah Amazon

Anthropic menunjukkan bahwa perintah Gedung Putih tersebut mungkin berasal dari kekhawatiran mengenai "jailbreaking"—metode yang digunakan untuk melewati batasan keamanan. Kekhawatiran ini kabarnya berasal dari sebuah makalah penelitian non-publik oleh para peneliti Amazon.

Makalah tersebut menunjukkan bahwa pengguna dapat melewati pembatasan keamanan Fable untuk mengakses kemampuan setingkat Mythos. Namun, para pakar keamanan siber, termasuk Katie Moussouris (pendiri Luta Security), berpendapat bahwa ini adalah kesalahpahaman mendasar tentang kegunaan AI. Moussouris menegaskan bahwa "jailbreak" yang dijelaskan hanyalah model yang menjalankan fungsi yang dimaksudkan: memperbaiki kode sumber terbuka (open-source) yang mengandung kerentanan yang diketahui.

Menurut Moussouris, meminta AI untuk memperbaiki bug, menjelaskan patch, dan menulis pengujian bukanlah pelanggaran keamanan; itu adalah "siklus temukan, perbaiki, dan uji" (find, fix, and test loop) yang mendefinisikan keamanan defensif modern. Upaya untuk memblokir perilaku ini pada dasarnya akan melumpuhkan kemampuan model tersebut dalam melindungi perangkat lunak.

Penandatangan Berisiko Tinggi dan Implikasi Industri

Surat terbuka ini didukung oleh tokoh-tokoh besar di komunitas keamanan, termasuk mantan kepala keamanan Facebook Alex Stamos, pendiri Bugcrowd Casey Ellis, dan kriptografer ternama Jon Callas. Argumen mereka berpusat pada ketidakseimbangan kritis: jika pihak bertahan dilarang mengakses LLM mutakhir sementara penyerang menggunakan model tanpa batasan, postur keamanan global akan melemah.

Para ahli juga menunjukkan bahwa kerentanan yang dirasakan pada Fable tidak hanya terjadi pada Anthropic. Surat tersebut menunjukkan bahwa "kerentanan" serupa dapat direplikasi pada GPT-5.5 milik OpenAI, Claude Opus 4.8 dan Sonnet milik Anthropic sendiri, bahkan model internasional seperti Kimi 2.7.

Kelompok ini menyerukan proses regulasi yang demokratis dan berbasis sains yang mengandalkan penelitian transparan, alih-alih larangan luas dan reaksioner yang mungkin justru lebih banyak membawa dampak buruk daripada manfaat.

Poin-Poin Penting