Tiga Perkataan
Seorang penyelidik menaip tiga perkataan ke dalam model AI paling berkuasa milik Anthropic: fix this code.
Dalam masa sembilan puluh minit, kerajaan Amerika Syarikat telah menghentikan model tersebut.
Kerentanan tersebut hanyalah satu arahan (prompt) yang mudah. Ia bukan serangan yang kompleks. Model tersebut memberikan data keselamatan siber yang sepatutnya disekat oleh sistem keselamatannya.
Jabatan Perdagangan menggunakan kuasa kawalan eksport untuk menghentikan model tersebut. Mereka mengarahkan Anthropic untuk menghalang semua warga asing daripada mengaksesnya. Ini termasuk sebahagian jurutera Anthropic sendiri. Anthropic telah menutup capaian model tersebut secara dalam talian bagi mengelakkan pengecualian kakitangannya sendiri.
Sebab rasminya adalah keselamatan negara. Namun, kisah ini mempunyai lapisan yang lebih mendalam.
Amazon menemui pintasan tersebut. CEO Amazon, Andy Jassy, memberitahu pegawai kerajaan mengenainya.
Amazon merupakan pelabur besar dalam Anthropic. Amazon juga menyediakan infrastruktur awan yang digunakan oleh Anthropic. Paling penting, produk AI Amazon sendiri bersaing dengan Anthropic.
Penemuan tersebut disalurkan daripada pesaing kepada kerajaan. Ia memintas syarikat yang membina model tersebut.
Peristiwa ini menunjukkan tiga perkara kritikal:
Risiko jenama: Anthropic membina reputasinya berasaskan keselamatan. Apabila model yang "selamat" gagal, kos politiknya menjadi lebih tinggi. Jenama tersebut menjadi satu liabiliti.
Struktur kuasa baharu: Amazon bertindak sebagai pelabur, penyedia, dan pesaing. Tiada industri lain yang mempunyai pengaturan seperti ini. Satu panggilan telefon daripada pesaing boleh mencetuskan mekanisme undang-undang untuk menutup sesebuah syarikat.
Campur tangan pantas: Kerajaan telah membuktikan bahawa ia boleh memaksa syarikat AI untuk menghentikan produk utamanya dalam masa kurang daripada dua jam. Tiada notis diberikan dan tiada proses rayuan.
Syarikat-syarikat AI menyangka mereka sama ada akan mengawal selia diri mereka sendiri atau berhadapan dengan dasar kerajaan. Mereka tidak merancang untuk pilihan ketiga.
Mereka tidak merancang untuk kawal selia melalui campur tangan mengejut yang dicetuskan oleh perisikan korporat.
Penyelidik keselamatan mahukan pagar keselamatan (guardrails) untuk AI. Mereka gagal menyedari siapa yang sebenarnya akan membinanya.
Source: https://dev.to/thesythesis/the-three-words-3ijl
Optional learning community: https://t.me/GyaanSetuAi