تكلفة حلقة الوكيل (Agent Loop): 11 ضعف تقديرك للتكلفة لكل استدعاء

تضع معظم الفرق ميزانيات وكلاء الذكاء الاصطناعي (AI agents) من خلال النظر إلى تكلفة الاستدعاء الواحد. فهم يرون السعر لكل مليون رمز (token) ويقدرون تكلفة إجراء واحد. هذا النهج خاطئ.

حلقة الوكيل (agent loop) لا تكلف نفس تكلفة الاستدعاء الواحد، بل تكلف أكثر بكثير.

السبب بسيط. في كل مرة يقوم فيها الوكيل باستدعاء أداة (tool call)، فإنه يعيد إرسال السياق بالكامل. أنت تدفع مقابل المطالبة النظامية (system prompt) مرة أخرى، وتدفع مقابل وصف كل أداة مرة أخرى، وتدفع مقابل تاريخ المحادثة بالكامل مرة أخرى.

مع استمرار الحلقة، يزداد حجم البيانات المرسلة (payload). وتزداد التكلفة بشكل تربيعي. أنت لا تدفع مقابل استدعاء واحد، بل تدفع مقابل المساحة تحت منحنى متصاعد.

لقد قمت ببناء أداة لقياس ذلك. وهي عبارة عن سكربت Python مكون من 40 سطرًا يسمى loop_forecast.py. تعمل الأداة دون اتصال بالإنترنت، ولا تتطلب مفاتيح (keyless)، وتقرأ سجلات JSONL الخاصة بك. وهي تخبرك بالتكلفة الحقيقية قبل نشر الكود الخاص بك.

في تجربة الاختبار الخاصة بي، كانت النتائج واضحة:

  • التكلفة المقدرة لكل استدعاء: $0.20
  • التكلفة الفعلية المقاسة لكل مهمة: $2.26
  • الفجوة: 11.29 ضعفًا

إذا كانت الحلقة قصيرة وبسيطة، فستظهر الأداة فجوة صغيرة. أما إذا كانت الحلقة ثقيلة، فستظهر فجوة هائلة. يمكنك استخدام هذا كبوابة في عملية التكامل المستمر (CI gate)؛ فإذا كانت فجوة التكلفة عالية جدًا، ستفشل عملية البناء (build).

توقف عن وضع الميزانية بناءً على عملية استدلال (inference) واحدة. استخدم سجلاتك الخاصة لمعرفة رقمك الحقيقي.

الميزات الرئيسية:

  • لا تتطلب الوصول إلى الشبكة أو مفاتيح API.
  • تستخدم tiktoken لإجراء عمليات عد دقيقة.
  • توفر مقياس انحناء (k) لتوضيح كيفية توسع التكاليف.
  • مخرجات حتمية (deterministic) لضمان موثوقية CI/CD.

الخطأ يكمن في الخلط بين الوحدات. المهمة ليست استدعاءً واحدًا، بل المهمة هي N من الاستدعاءات، وكل منها يحمل ضريبة متزايدة.

المصدر: https://dev.to/alex_spinov/agent-loop-cost-11x-your-per-call-quote-in-40-lines-5dfn

مجتمع تعليمي اختياري: https://t.me/GyaanSetuAi