Berhenti Memercayai Agen: Ikat Persetujuan pada Pemanggilan Tool yang Spesifik

Sebagian besar sistem agentic melindungi tindakan berbahaya seperti penulisan file atau transfer uang dengan persetujuan sederhana.

Biasanya, persetujuan ini adalah flag boolean dalam status sistem. Contoh: approved: true.

Ini adalah sebuah kesalahan. Boolean gagal dalam tiga cara yang dieksploitasi oleh penyerang:

Masalahnya adalah Anda memodelkan persetujuan sebagai properti dari seluruh sesi. Persetujuan harus menjadi bukti untuk satu pemanggilan spesifik.

Cara memperbaikinya:

Saat manusia menyetujui sebuah pemanggilan, buatlah tag yang aman. Tag ini harus mengunci empat hal berikut:

Verifikasi tag ini pada saat eksekusi yang tepat. Gunakan kunci rahasia yang hanya diketahui oleh sistem.

Ikuti aturan berikut untuk implementasi:

Otorisasi tidak boleh menjadi potongan status yang mengambang. Ia harus menjadi amplop terikat yang membuktikan: "Orang spesifik ini menyetujui argumen spesifik ini untuk tool spesifik ini hingga waktu spesifik ini."

Berhenti menggunakan boolean. Itu bukan penyederhanaan. Itu adalah bug.

Sumber: https://dev.to/whatsonyourmind/stop-trusting-the-agent-bind-tool-call-approvals-to-the-exact-call-5080

Komunitas pembelajaran opsional: https://t.me/GyaanSetuAi