שליפות מוגבלות עבור קריאות כלים של סוכן

📅4 hours ago⏱2 min read

ניסיונות חוזרים מוגבלים לקריאות כלים של סוכנים

האירוע הגרוע ביותר שהסוכן שלנו גרם לא היה תשובה שגויה. זה היה לולאה.

קריאה לכלי נכשלה. הסוכן ניסה שוב. הניסיון החוזר נכשל שוב. הסוכן המשיך הלאה. הוא שרף טוקנים והכה ב-API שלנו מאות פעמים בדקה אחת.

הסוכן עשה את מה שאמרנו לו לעשות. אמרנו לו לנסות שוב אם כלי נכשל. שכחנו להגיד לו מתי להפסיק.

ניסיונות חוזרים (Retries) טובים לשגיאות זמניות. הבעיה היא שסוכנים לא יכולים להבחין בין שגיאה זמנית לשגיאה קבועה. ללא מגבלות, סוכן ינסה שוב קריאה תקולה עד שמשהו יעצור אותו.

קוד מסורתי משתמש במגבלות ניסיון חוזר. קריאות כלים של סוכנים העבירו את ההחלטה הזו אל תוך תהליך ההסקה (reasoning) של המודל. זה הפך את הלולאה לבלתי נראית ולא מוגבלת.

תיקנו זאת על ידי הוספת שני תקציבים מחוץ למודל:

• תקרת קריאה (Per-call cap): לכלי ספציפי מוקצית מספר קבוע של ניסיונות. אם הוא נכשל, הסוכן חייב לנסות נתיב אחר. • תקציב לכל סשן (Per-session budget): למשימה כולה יש מגבלה על סך כל קריאות הכלים. אם הסוכן מגיע למגבלה זו, הוא עוצר ומבקש עזרה.

המגבלה עצמה אינה הפתרון. מה שקורה אחרי המגבלה הוא מה שחשוב.

אם פשוט עוצרים, הסוכן נתקע. במקום זאת, אנחנו נותנים לסוכן הודעה ברורה. אנחנו אומרים לו שהקריאה נכשלה ושהוא לא חייב לנסות שוב. זה הופך לולאה להחלטה. בדרך כלל, הסוכן בוחר אז גישה חדשה.

מאז שהוספנו זאת, לולאות של שימוש לרעה בכלים כמעט נעלמו. כשהן קורות, הן מסתיימות בצורה מסודרת במקום ליצור חשבונות API ענקיים.

מציאת המגבלה הנכונה היא קשה. מגבלה הדוקה מדי הורגת משימות ארוכות. מגבלה רחבה מדי מאפשרת לולאות יקרות. אנחנו קובעים את המגבלות שלנו בהתבסס על אורך משימות בפרצנטיל ה-95.

האם יש לכם דרך טובה יותר לקבוע את התקציבים האלו? ספרו לי בתגובות.

Source: https://dev.to/james_oconnor_dev/bounded-retries-for-agent-tool-calls-the-budget-that-stopped-our-infinite-loop-incidents-4354

קהילת למידה אופציונלית: https://t.me/GyaanSetuAi

שליפות מוגבלות עבור קריאות כלים של סוכן

Continue reading

𝗧𝗵𝗲 𝗕𝗹𝗶𝗻𝗱 𝗦𝗽𝗼𝘁 𝗢𝗳 𝗔𝗜 𝗔𝗴𝗲𝗻𝘁𝘀

𝗔𝗴𝗲𝗻𝘁𝗶𝗰 𝗔𝗜 𝗜𝗻𝗰𝗶𝗱𝗲𝗻𝘁 𝗥𝗲𝘀𝗽𝗼𝗻𝘀𝗲: 𝗥𝗼𝗹𝗹 𝗕𝗮𝗰𝗸 𝗥𝗼𝗴𝘂𝗲 𝗔𝗴𝗲𝗻𝘁𝘀

𝗛𝗼𝘄 𝗜 𝗦𝘁𝗼𝗽𝗽𝗲𝗱 𝗟𝗼𝘀𝗶𝗻𝗴 𝗔𝗣𝗜 𝗖𝗮𝗹𝗹𝘀 𝘁𝗼 𝗥𝗮𝘁𝗲 𝗟𝗶𝗺𝗶𝘁𝘀

𝗛𝗼𝘄 𝗜 𝗦𝘁𝗼𝗽𝗽𝗲𝗱 𝗟𝗼𝘀𝗶𝗻𝗴 𝗔𝗣𝗜 𝗖𝗮𝗹𝗹𝘀 𝘁𝗼 𝗥𝗮𝘁𝗲 𝗟𝗶𝗺𝗶𝘁𝘀

𝗬𝗼𝘂𝗿 𝗔𝗜 𝗔𝗴𝗲𝗻𝘁 𝗪𝗶𝗹𝗹 𝗗𝗼𝘂𝗯𝗹𝗲 𝗖𝗵𝗮𝗿𝗴𝗲 𝗼𝗻 𝗮 𝗟𝗼𝘀𝘁 𝗥𝗲𝘀𝗽𝗼𝗻𝘀𝗲