एजंटवर विश्वास ठेवणे थांबवा: मंजुरीला (Approvals) नेमक्या टूल कॉल्सशी (Tool Calls) जोडा

बहुतेक एजन्टिक सिस्टिम्स (agentic systems) फाईल लिहिणे किंवा पैसे हस्तांतरित करणे यांसारख्या धोकादायक कृतींना केवळ एका साध्या मंजुरीने (approval) सुरक्षित ठेवतात.

सहसा, ही मंजुरी सिस्टिम स्टेटमधील एक बुलियन फ्लॅग (boolean flag) असते. उदाहरण: approved: true.

ही एक चूक आहे. बुलियन तीन प्रकारे अपयशी ठरते ज्याचा फायदा हल्लेखोर (attackers) घेऊ शकतात:

समस्या अशी आहे की तुम्ही मंजुरीला संपूर्ण सेशनचा (session) एक गुणधर्म म्हणून मॉडेल करत आहात. ती एका विशिष्ट कॉलसाठी पुरावा (evidence) असणे आवश्यक आहे.

हे कसे सुधारावे:

जेव्हा एखादी व्यक्ती कॉल मंजूर करते, तेव्हा एक सुरक्षित टॅग (secure tag) तयार करा. या टॅगमध्ये या चार गोष्टी लॉक होणे आवश्यक आहे:

अंमलबजावणीच्या (execution) नेमक्या वेळी या टॅगची पडताळणी करा. फक्त सिस्टिमला माहित असलेली सिक्रेट की (secret key) वापरा.

अंमलबजावणीसाठी या नियमांचे पालन करा:

ऑथोरायझेशन (Authorization) हे स्टेटचा एखादा तरंगता भाग नसावा. ते एक बांधलेले पाकीट (bound envelope) असावे जे सिद्ध करते: "या विशिष्ट व्यक्तीने या विशिष्ट टूलसाठी, या विशिष्ट वेळेपर्यंत, या विशिष्ट आर्ग्युमेंट्सना मंजुरी दिली आहे."

बुलियन वापरणे थांबवा. ते सोपेपणाचे साधन नाहीत. ते एक बग (bug) आहेत.

स्रोत: https://dev.to/whatsonyourmind/stop-trusting-the-agent-bind-tool-call-approvals-to-the-exact-call-5080

पर्यायी लर्निंग कम्युनिटी: https://t.me/GyaanSetuAi