Tidak Ada Pull Request Untuk Agen Otonom
Tinjauan keamanan tradisional bergantung pada diff. Seseorang membuka pull request. Seseorang membacanya. Kode di produksi sesuai dengan kode yang Anda tinjau.
Agen otonom merusak model ini.
Sebuah agen merencanakan dan memanggil alat (tools) saat runtime. Ia tidak mengirimkan tindakan dalam sebuah commit. Ia memutuskan tindakan saat sedang berjalan. Jika Anda hanya meninjau kode aplikasi, Anda melewatkan risiko yang sebenarnya.
Agen bukan sekadar kode. Ia adalah konfigurasi runtime. Konfigurasi ini mencakup:
• Prompt sistem • Harness atau loop • Tool surface • Memori dan identitas • Kebijakan egress jaringan • Container images
Dua agen yang menggunakan model yang sama dapat bertindak secara berbeda berdasarkan pengaturan ini. Modelnya tetap sama. Konfigurasinya mengubah segalanya.
Banyak tim memperlakukan prompt sistem sebagai pengaturan kotak teks biasa. Mereka mengeditnya di dashboard. Ini adalah sebuah kesalahan. Perubahan satu baris saja dapat menghapus guardrail. Prompt yang dapat diedit adalah jalur kode yang tidak ditinjau.
Insiden nyata membuktikan hal ini:
• Sebuah bot memberikan saran ilegal kepada pemilik properti selama berminggu-minggu. • Sebuah bot dukungan mulai memaki pelanggan karena pembaruan prompt. • File berbahaya menggunakan karakter tak terlihat untuk melewati aturan.
Ini bukan kegagalan model. Ini adalah perubahan konfigurasi yang tidak ditinjau oleh siapa pun.
Anda harus memperlakukan konfigurasi seperti kode.
Masukkan prompt sistem dan konfigurasi harness Anda ke dalam version control. Ubah hanya melalui pull request. Gunakan diff untuk melihat apa yang berubah.
Gunakan content hash untuk konfigurasi yang Anda deploy. Hash ini harus mencakup versi prompt, ID model, dan digest kontainer. Jika Anda mengubah prompt, identitas agen tersebut berubah. Anda tidak dapat menukar prompt secara diam-diam.
Terapkan deteksi drift pada agent surface. Jangan hanya memantau host. Pantau daftar server MCP dan kebijakan egress khusus untuk agen tersebut.
Saat melakukan logging, lacak dua hal ini:
• Ukuran konteks saat pengambilan keputusan: Seberapa banyak informasi yang dimiliki model saat ia bertindak? • Parent prompt: Dalam sistem multi-agent, apa yang dikirimkan oleh agen pemanggil?
Anda tidak memerlukan alat baru. Gunakan version control dan structured logging yang sudah ada. Anda hanya perlu mengarahkannya ke tempat yang tepat.
Apakah Anda melakukan versioning dan meninjau prompt sistem Anda? Atau apakah siapa pun dengan akses konsol dapat mengubahnya tanpa jejak?
Komunitas pembelajaran opsional: https://t.me/GyaanSetuAi
