Hören Sie auf, dem Agenten blind zu vertrauen: Binden Sie Genehmigungen an exakte Tool-Aufrufe

Die meisten agentischen Systeme schützen gefährliche Aktionen wie das Schreiben von Dateien oder Geldtransfers durch eine einfache Genehmigung.

Normalerweise ist diese Genehmigung ein Boolean-Flag im Systemzustand. Beispiel: approved: true.

Das ist ein Fehler. Ein Boolean versagt auf drei Arten, die Angreifer ausnutzen:

Das Problem ist, dass Sie die Genehmigung als eine Eigenschaft der gesamten Sitzung modellieren. Sie muss ein Nachweis für einen ganz spezifischen Aufruf sein.

So beheben Sie es:

Wenn ein Mensch einen Aufruf genehmigt, erstellen Sie ein sicheres Tag. Dieses Tag muss die folgenden vier Dinge sperren:

Verifizieren Sie dieses Tag zum exakten Zeitpunkt der Ausführung. Verwenden Sie einen geheimen Schlüssel, den nur das System kennt.

Befolgen Sie diese Regeln für die Implementierung:

Autorisierung sollte kein schwebender Zustand sein. Sie muss ein gebundener Umschlag sein, der beweist: „Diese spezifische Person hat diese spezifischen Argumente für dieses spezifische Tool bis zu diesem spezifischen Zeitpunkt genehmigt.“

Hören Sie auf, Booleans zu verwenden. Sie sind keine Vereinfachung. Sie sind ein Bug.

Quelle: https://dev.to/whatsonyourmind/stop-trusting-the-agent-bind-tool-call-approvals-to-the-exact-call-5080

Optionale Lern-Community: https://t.me/GyaanSetuAi