𝗦𝘁𝗼𝗽 𝗧𝗿𝘂𝘀𝘁𝗶𝗻𝗴 𝗧𝗵𝗲 𝗔𝗴𝗲𝗻𝘁: 𝗕𝗶𝗻𝗱 𝗔𝗽𝗽𝗿𝗼𝘃𝗮𝗹𝘀 𝘁𝗼 𝗘𝘅𝗮𝗰𝘁 𝗧𝗼𝗼𝗹 𝗖𝗮𝗹𝗹𝘀

Machine-translated. Read the original.

📅4 hours ago⏱2 min read

הפסיקו לבטוח בסוכן: קשרו אישורים לקריאות כלי ספציפיות

רוב המערכות האג'נטיות (agentic systems) מגינות על פעולות מסוכנות כמו כתיבת קבצים או העברות כספים באמצעות אישור פשוט.

בדרך כלל, האישור הזה הוא דגל בוליאני (boolean flag) במצב המערכת. דוגמה: approved: true.

זו טעות. ערך בוליאני נכשל בשלוש דרכים שתוקפים מנצלים:

הפיכה (Flip): תוקף משנה את המצב מ-false ל-true באמצעות prompt injection או פגמים בקוד.
השמעה חוזרת (Replay): אתם מאשרים פקודה בטוחה כמו "read file". המערכת רואה "true" ומאפשרת פקודה שנייה ומסוכנת כמו "delete database".
סטייה בארגומנטים (Argument Drift): אתם מאשרים "send $10". תוקף משנה את הסכום ל-$10,000 לפני הביצוע. הדגל עדיין מציג "true".

הבעיה היא שאתם ממדלים את האישור כתכונה של כל הסשן (session) כולו. הוא חייב לשמש כראיה עבור קריאה ספציפית אחת.

איך לתקן את זה:

כאשר אדם מאשר קריאה, צרו תג (tag) מאובטח. התג הזה חייב לנעול ארבעה דברים:

את ה-ID הייחודי של קריאת הכלי.
האש (hash) של הארגומנטים המדויקים.
את זהות המשתמש.
זמן תפוגה.

אמתו את התג הזה ברגע הביצוע המדויק. השתמשו במפתח סודי שרק המערכת מכירה.

עקבו אחר הכללים הבאים ליישום:

השתמשו ב-Canonicalization: גם המאשר וגם המבצע חייבים לבצע hash לאותם בייטים בדיוק. השתמשו ב-RFC 8785 כדי להבטיח שמספרים ומפתחות תואמים.
Fail Closed: אם תג חסר, פג תוקף או שגוי, החזירו שגיאת "not approved" ספציפית. אל תתייחסו אליה כתוצאה סטנדרטית של כלי.
Deny by Default: אפשרו רק כלים הדורשים אישור מפורש. דחו כל דבר אחר.
טיפול ב-Replays: אם אתם משתמשים במנועים כמו Temporal, ודאו שהמפתח הסודי שלכם הוא דטרמיניסטי. אם המפתח משתנה לאחר הפעלה מחדש של המערכת, כל האישורים הקיימים ייכשלו.

הרשאה (Authorization) לא צריכה להיות חלק צף של מצב (state). היא חייבת להיות מעטפה קשורה שמוכיחה: "האדם הספציפי הזה אישר את הארגומנטים הספציפיים האלה עבור הכלי הספציפי הזה עד לזמן הספציפי הזה."

הפסיקו להשתמש בערכים בוליאניים. הם אינם פישוט. הם באג.

מקור: https://dev.to/whatsonyourmind/stop-trusting-the-agent-bind-tool-call-approvals-to-the-exact-call-5080

קהילת למידה אופציונלית: https://t.me/GyaanSetuAi

𝗦𝘁𝗼𝗽 𝗧𝗿𝘂𝘀𝘁𝗶𝗻𝗴 𝗧𝗵𝗲 𝗔𝗴𝗲𝗻𝘁: 𝗕𝗶𝗻𝗱 𝗔𝗽𝗽𝗿𝗼𝘃𝗮𝗹𝘀 𝘁𝗼 𝗘𝘅𝗮𝗰𝘁 𝗧𝗼𝗼𝗹 𝗖𝗮𝗹𝗹𝘀

Continue reading

𝗔𝗴𝗲𝗻𝘁𝗶𝗰 𝗔𝗜 𝗜𝗻𝗰𝗶𝗱𝗲𝗻𝘁 𝗥𝗲𝘀𝗽𝗼𝗻𝘀𝗲: 𝗥𝗼𝗹𝗹 𝗕𝗮𝗰𝗸 𝗥𝗼𝗴𝘂𝗲 𝗔𝗴𝗲𝗻𝘁𝘀

𝗧𝗵𝗲 𝗔𝗴𝗲𝗻𝘁𝗶𝗰 𝗔𝗜 𝗚𝗼𝘃𝗲𝗿𝗻𝗮𝗻𝗰𝗲 𝗙𝗿𝗮𝗺𝗲𝘄𝗼𝗿𝗸

סוכן הקוד שלי ביקש אישור על כל צעד קטן

𝗕𝘂𝗶𝗹𝗱𝗶𝗻𝗴 𝗧𝗵𝗲 𝗣𝗿𝗼𝗱𝘂𝗰𝘁𝗶𝗼𝗻 𝗔𝗴𝗲𝗻𝘁 𝗟𝗼𝗼𝗽

𝗔𝗜 𝗔𝗴𝗲𝗻𝘁𝘀 𝗛𝗮𝘃𝗲 𝗔 𝗥𝗲𝗹𝗶𝗮𝗯𝗶𝗹𝗶𝘁𝘆 𝗣𝗿𝗼𝗯𝗹𝗲𝗺