𝗕𝗼𝘂𝗻𝗱𝗲𝗱 𝗥𝗲𝘁𝗿𝗶𝗲𝘀 𝗙𝗼𝗿 𝗔𝗴𝗲𝗻𝘁 𝗧𝗼𝗼𝗹 𝗖𝗮𝗹𝗹𝘀

📅4 hours ago⏱2 min read

Begrenzte Retries für Agent-Tool-Calls

Der schlimmste Vorfall, den unser Agent verursacht hat, war keine falsche Antwort. Es war eine Endlosschleife.

Ein Tool-Aufruf schlug fehl. Der Agent versuchte es erneut. Der erneute Versuch schlug wieder fehl. Der Agent machte einfach weiter. Er verbrauchte massenhaft Token und griff innerhalb einer Minute hunderte Male auf unsere API zu.

Der Agent tat genau das, was wir ihm gesagt hatten. Wir sagten ihm, er solle es erneut versuchen, wenn ein Tool fehlschlägt. Wir vergaßen zu sagen, wann er aufhören soll.

Retries sind gut bei temporären Fehlern. Das Problem ist, dass Agenten keinen Unterschied zwischen einem temporären und einem permanenten Fehler erkennen können. Ohne Limits wiederholt ein Agent einen fehlerhaften Aufruf so lange, bis etwas ihn stoppt.

Traditioneller Code verwendet Retry-Limits. Bei Agent-Tool-Calls wurde diese Entscheidung in das Reasoning des Modells verlagert. Das machte die Schleife unsichtbar und unbegrenzt.

Wir haben dies behoben, indem wir zwei Budgets außerhalb des Modells eingeführt haben:

• Pro-Aufruf-Limit: Ein bestimmtes Tool erhält eine festgelegte Anzahl an Versuchen. Wenn es fehlschlägt, muss der Agent einen anderen Weg wählen. • Pro-Session-Budget: Die gesamte Aufgabe hat ein Limit für die Gesamtzahl der Tool-Aufrufe. Wenn der Agent dieses Limit erreicht, stoppt er und bittet um Hilfe.

Das Limit allein ist nicht die Lösung. Entscheidend ist, was nach dem Erreichen des Limits passiert.

Wenn man einfach nur stoppt, bleibt der Agent stecken. Stattdessen geben wir dem Agenten eine klare Nachricht. Wir sagen ihm, dass der Aufruf fehlgeschlagen ist und er keinen weiteren Versuch unternehmen darf. Das verwandelt eine Schleife in eine Entscheidung. In der Regel wählt der Agent dann einen neuen Ansatz.

Seit wir dies implementiert haben, sind Schleifen durch Tool-Missbrauch fast vollständig verschwunden. Wenn sie doch einmal auftreten, eskalieren sie kontrolliert, anstatt riesige API-Rechnungen zu verursachen.

Das richtige Limit zu finden, ist schwierig. Ein zu enges Limit unterbricht langwierige Aufgaben. Ein zu lockeres Limit erlaubt teure Schleifen. Wir legen unsere Limits basierend auf der Task-Länge des 95. Perzentils fest.

Haben Sie eine bessere Methode, um diese Budgets festzulegen? Lassen Sie es mich in den Kommentaren wissen.

Quelle: https://dev.to/james_oconnor_dev/bounded-retries-for-agent-tool-calls-the-budget-that-stopped-our-infinite-loop-incidents-4354

Optionale Lern-Community: https://t.me/GyaanSetuAi

𝗕𝗼𝘂𝗻𝗱𝗲𝗱 𝗥𝗲𝘁𝗿𝗶𝗲𝘀 𝗙𝗼𝗿 𝗔𝗴𝗲𝗻𝘁 𝗧𝗼𝗼𝗹 𝗖𝗮𝗹𝗹𝘀

Continue reading

𝗧𝗵𝗲 𝗕𝗹𝗶𝗻𝗱 𝗦𝗽𝗼𝘁 𝗢𝗳 𝗔𝗜 𝗔𝗴𝗲𝗻𝘁𝘀

𝗔𝗴𝗲𝗻𝘁𝗶𝗰 𝗔𝗜 𝗜𝗻𝗰𝗶𝗱𝗲𝗻𝘁 𝗥𝗲𝘀𝗽𝗼𝗻𝘀𝗲: 𝗥𝗼𝗹𝗹 𝗕𝗮𝗰𝗸 𝗥𝗼𝗴𝘂𝗲 𝗔𝗴𝗲𝗻𝘁𝘀

𝗛𝗼𝘄 𝗜 𝗦𝘁𝗼𝗽𝗽𝗲𝗱 𝗟𝗼𝘀𝗶𝗻𝗴 𝗔𝗣𝗜 𝗖𝗮𝗹𝗹𝘀 𝘁𝗼 𝗥𝗮𝘁𝗲 𝗟𝗶𝗺𝗶𝘁𝘀

𝗛𝗼𝘄 𝗜 𝗦𝘁𝗼𝗽𝗽𝗲𝗱 𝗟𝗼𝘀𝗶𝗻𝗴 𝗔𝗣𝗜 𝗖𝗮𝗹𝗹𝘀 𝘁𝗼 𝗥𝗮𝘁𝗲 𝗟𝗶𝗺𝗶𝘁𝘀

𝗬𝗼𝘂𝗿 𝗔𝗜 𝗔𝗴𝗲𝗻𝘁 𝗪𝗶𝗹𝗹 𝗗𝗼𝘂𝗯𝗹𝗲 𝗖𝗵𝗮𝗿𝗴𝗲 𝗼𝗻 𝗮 𝗟𝗼𝘀𝘁 𝗥𝗲𝘀𝗽𝗼𝗻𝘀𝗲