Tiga Perkataan

Seorang penyelidik menaip tiga perkataan ke dalam model AI paling berkuasa milik Anthropic: fix this code.

Dalam masa sembilan puluh minit, kerajaan Amerika Syarikat telah menghentikan model tersebut.

Kerentanan tersebut hanyalah satu arahan (prompt) yang mudah. Ia bukan serangan yang kompleks. Model tersebut memberikan data keselamatan siber yang sepatutnya disekat oleh sistem keselamatannya.

Jabatan Perdagangan menggunakan kuasa kawalan eksport untuk menghentikan model tersebut. Mereka mengarahkan Anthropic untuk menghalang semua warga asing daripada mengaksesnya. Ini termasuk sebahagian jurutera Anthropic sendiri. Anthropic telah menutup capaian model tersebut secara dalam talian bagi mengelakkan pengecualian kakitangannya sendiri.

Sebab rasminya adalah keselamatan negara. Namun, kisah ini mempunyai lapisan yang lebih mendalam.

Amazon menemui pintasan tersebut. CEO Amazon, Andy Jassy, memberitahu pegawai kerajaan mengenainya.

Amazon merupakan pelabur besar dalam Anthropic. Amazon juga menyediakan infrastruktur awan yang digunakan oleh Anthropic. Paling penting, produk AI Amazon sendiri bersaing dengan Anthropic.

Penemuan tersebut disalurkan daripada pesaing kepada kerajaan. Ia memintas syarikat yang membina model tersebut.

Peristiwa ini menunjukkan tiga perkara kritikal:

Syarikat-syarikat AI menyangka mereka sama ada akan mengawal selia diri mereka sendiri atau berhadapan dengan dasar kerajaan. Mereka tidak merancang untuk pilihan ketiga.

Mereka tidak merancang untuk kawal selia melalui campur tangan mengejut yang dicetuskan oleh perisikan korporat.

Penyelidik keselamatan mahukan pagar keselamatan (guardrails) untuk AI. Mereka gagal menyedari siapa yang sebenarnya akan membinanya.

Source: https://dev.to/thesythesis/the-three-words-3ijl

Optional learning community: https://t.me/GyaanSetuAi