𝗦𝘁𝗼𝗽 𝗧𝗿𝘂𝘀𝘁𝗶𝗻𝗴 𝗧𝗵𝗲 𝗔𝗴𝗲𝗻𝘁: 𝗕𝗶𝗻𝗱 𝗔𝗽𝗽𝗿𝗼𝘃𝗮𝗹𝘀 𝘁𝗼 𝗘𝘅𝗮𝗰𝘁 𝗧𝗼𝗼𝗹 𝗖𝗮𝗹𝗹𝘀

Hầu hết các hệ thống agentic bảo vệ các hành động nguy hiểm như ghi tệp hoặc chuyển tiền bằng một sự phê duyệt đơn giản.

Thông thường, sự phê duyệt này là một cờ boolean trong trạng thái hệ thống. Ví dụ: approved: true.

Đây là một sai lầm. Một giá trị boolean sẽ thất bại theo ba cách mà kẻ tấn công có thể khai thác:

Vấn đề là bạn đang mô hình hóa sự phê duyệt như một thuộc tính của toàn bộ phiên làm việc (session). Nó phải là bằng chứng cho một lệnh gọi cụ thể.

Cách khắc phục:

Khi con người phê duyệt một lệnh gọi, hãy tạo một thẻ (tag) bảo mật. Thẻ này phải khóa bốn yếu tố sau:

Xác minh thẻ này ngay tại thời điểm thực thi. Sử dụng một khóa bí mật (secret key) mà chỉ hệ thống mới biết.

Tuân thủ các quy tắc sau để triển khai:

Việc ủy quyền không nên là một phần trạng thái trôi nổi. Nó phải là một "phong bì" được ràng buộc để chứng minh rằng: "Người cụ thể này đã phê duyệt các tham số cụ thể này cho công cụ cụ thể này cho đến thời điểm cụ thể này."

Hãy ngừng sử dụng boolean. Chúng không phải là một sự đơn giản hóa. Chúng là một lỗi (bug).

Source: https://dev.to/whatsonyourmind/stop-trusting-the-agent-bind-tool-call-approvals-to-the-exact-call-5080

Optional learning community: https://t.me/GyaanSetuAi