𝗔𝗴𝗲𝗻𝘁 𝗟𝗼𝗼𝗽 𝗖𝗼𝘀𝘁: 𝟭𝟭𝘅 𝗬𝗼𝘂𝗿 𝗣𝗲𝗿 𝗖𝗮𝗹𝗹 𝗤𝘂𝗼𝘁𝗲

Translated for your language. Read the original.

AI-assisted draft.

GyaanSetu Editorial20 godzin temu2min read

Koszt pętli agenta: 11-krotność Twojej wyceny za pojedyncze wywołanie

Większość zespołów planuje budżet na agentów AI, patrząc na koszt pojedynczego wywołania. Widzą cenę za milion tokenów i szacują koszt jednej akcji. To podejście jest błędne.

Pętla agenta nie kosztuje tyle samo, co pojedyncze wywołanie. Kosztuje znacznie więcej.

Powód jest prosty. Za każdym razem, gdy agent wykonuje wywołanie narzędzia (tool call), przesyła ponownie cały kontekst. Ponownie płacisz za system prompt. Ponownie płacisz za każdy opis narzędzia. Ponownie płacisz za całą historię konwersacji.

W miarę trwania pętli, rozmiar przesyłanych danych (payload) rośnie. Koszt rośnie kwadratowo. Nie płacisz za pojedyncze wywołanie. Płacisz za pole pod rosnącą krzywą.

Stworzyłem narzędzie, aby to zmierzyć. Jest to 40-liniowy skrypt Python o nazwie loop_forecast.py. Działa offline, nie wymaga kluczy i odczytuje Twoje trace'y w formacie JSONL. Powie Ci o rzeczywistym koszcie, zanim wdrożysz swój kod.

W moim teście wyniki były jasne:

Szacowany koszt na wywołanie: $0.20
Zmierzony efektywny koszt zadania: $2.26
Luka: 11,29x

Jeśli Twoja pętla jest krótka i prosta, narzędzie wykaże niewielką różnicę. Jeśli Twoja pętla jest rozbudowana, pokaże ogromne przekroczenie. Możesz użyć tego jako bramki CI. Jeśli luka kosztowa jest zbyt wysoka, build zakończy się niepowodzeniem.

Przestań planować budżet w oparciu o pojedynczą inferencję. Użyj własnych trace'ów, aby poznać swoją rzeczywistą liczbę.

Kluczowe funkcje:

Brak konieczności dostępu do sieci lub kluczy API.
Wykorzystuje tiktoken do dokładnego liczenia.
Dostarcza metrykę krzywizny (k), aby pokazać, jak skalują się koszty.
Deterministyczny wynik dla niezawodnego CI/CD.

Błędem jest mylenie jednostek. Zadanie to nie jedno wywołanie. Zadanie to N wywołań, z których każde wiąże się z rosnącym „podatkiem”.

Źródło: https://dev.to/alex_spinov/agent-loop-cost-11x-your-per-call-quote-in-40-lines-5dfn

Opcjonalna społeczność edukacyjna: https://t.me/GyaanSetuAi

𝗔𝗴𝗲𝗻𝘁 𝗟𝗼𝗼𝗽 𝗖𝗼𝘀𝘁: 𝟭𝟭𝘅 𝗬𝗼𝘂𝗿 𝗣𝗲𝗿 𝗖𝗮𝗹𝗹 𝗤𝘂𝗼𝘁𝗲

Continue reading

𝗧𝗵𝗲 𝗠𝗖𝗣 𝗖𝗼𝗻𝘁𝗲𝘅𝘁 𝗧𝗮𝘅

𝗔𝗜 𝗔𝗴𝗲𝗻𝘁 𝗖𝗼𝘀𝘁 𝗜𝘀 𝗮 𝗥𝘂𝗻𝘁𝗶𝗺𝗲 𝗦𝗶𝗴𝗻𝗮𝗹

𝗧𝗵𝗲 𝗥𝗲𝗮𝗹 𝗖𝗼𝘀𝘁 𝗼𝗳 𝗔𝗜 𝗔𝗣𝗜𝘀

𝗪𝗵𝘆 𝗬𝗼𝘂𝗿 𝗔𝗴𝗲𝗻𝘁𝘀 𝗔𝗿𝗲 𝗕𝘂𝗿𝗻𝗶𝗻𝗴 𝗧𝗼𝗸𝗲𝗻𝘀

𝗜 𝗖𝘂𝘁 𝗠𝘆 𝗔𝗜 𝗔𝗴𝗲𝗻𝘁'𝘀 𝗧𝗼𝗸𝗲𝗻 𝗕𝗶𝗹𝗹 𝗯𝘆 𝟲𝟮% 𝗶𝗻 𝗢𝗻𝗲 𝗪𝗲𝗲𝗸𝗲𝗻𝗱