Menggunakan AI Tanpa Membocorkan Rahsia
Anda menghadapi ralat. Anda menyalin stack trace. Anda meminta AI untuk membaikinya. Anda terlupa bahawa DATABASE_URL dan kata laluan anda ada dalam teks tersebut. AI menjawab dalam masa empat saat. Kini rahsia anda berada dalam log permintaan atau set latihan. Anda tidak boleh memadamnya.
Menampal rahsia ke dalam AI adalah seperti menampalnya ke laman web awam. Anda tidak boleh menariknya semula.
Saya menggunakan AI setiap hari untuk menghantar kod. Saya tidak mengelaknya. Saya menggunakannya dengan model ancaman (threat model).
Kebanyakan orang menyangka prompt adalah sembang peribadi. Ia tidak begitu. Ia adalah permintaan keluar (outbound request).
- Peringkat percuma sering menggunakan data anda untuk melatih model.
- Peringkat berbayar biasanya berjanji untuk tidak melatih model menggunakan data anda.
- Malah peringkat berbayar pun menyimpan log untuk pengesanan penyalahgunaan dan semakan manusia.
Kebocoran data berlaku dalam tiga cara:
- Apa yang anda tampal: petikan kod, konfigurasi, atau trace.
- Apa yang dilampirkan secara automatik oleh alatan: fail yang terbuka, konteks repo, atau output terminal.
- Apa yang dihantar semula oleh model: rahsia yang diulang dalam deskripsi PR atau log.
Penyedia AI adalah pihak ketiga yang dipercayai. Anda tidak boleh mengaudit saluran dalaman (internal pipelines) mereka. Anggap kotak prompt seperti panggilan rangkaian yang tidak dipercayai.
Berhenti menghantar perkara ini:
- Kunci API atau token yang aktif.
- Kandungan fail
.env. - Kunci peribadi atau sijil.
- Nama pelanggan, e-mel, atau data pembayaran yang sebenar.
- Logik proprietari yang tidak akan anda jadikan sumber terbuka (open-source).
Gunakan placeholder sebagai ganti. Gunakan [API_KEY] atau [DB_PASSWORD]. AI berfungsi dengan baik walaupun menggunakan topeng (masks).
Bina tiga tabiat ini:
- Gunakan fail ignore AI. Pastikan
.envdan folder rahsia berada di luar konteks alatan tersebut. - Imbas sebelum menghantar. Jalankan pengesan rahsia pada teks anda sebelum menampalnya.
- Simpan rahsia dalam bentuk tersulit (encrypted). Jika rahsia hanya wujud dalam memori semasa waktu larian (runtime), anda tidak boleh menampalnya.
Ringkasan pilihan anda:
- Percuma/Pengguna: Gunakan untuk dokumen awam atau petikan kod sementara.
- Berbayar Pro/Pasukan: Gunakan untuk kebanyakan kerja kejuruteraan. Ia mempunyai perlindungan kontrak.
- Tempatan/Hos-sendiri: Gunakan untuk data terkawal yang mesti kekal pada mesin anda.
Jaminan tanpa latihan adalah satu kontrak. Ia bukan perisai teknikal. Ia mengurangkan risiko tetapi tidak menghapuskannya.
Ikuti langkah-langkah ini sebelum AI menyentuh kod anda:
- Tambah fail ignore untuk alatan AI anda.
- Imbas semua yang anda tampal.
- Topeng semua kredential dengan placeholder.
- Gunakan peringkat berbayar untuk kerja proprietari.
- Gunakan KMS untuk memastikan rahsia tidak dalam bentuk teks biasa (plaintext).
- Semak output AI sebelum ia masuk ke dalam log atau commit anda.
Jawapan empat saat itu tetap pantas. Ia cuma tidak mengorbankan keselamatan anda.
Komuniti pembelajaran pilihan: https://t.me/GyaanSetuAi
