Agent 循环成本:是单次调用报价的 11 倍

大多数团队在为 AI Agent 制定预算时,只看单次调用的成本。他们看到每百万 token 的价格,然后以此估算单个动作的成本。这种方法是错误的。

Agent 循环的成本并不等同于单次调用。它的成本要高得多。

原因很简单。每当 Agent 进行工具调用(tool call)时,它都会重新发送整个上下文。你再次为系统提示词(system prompt)付费。你再次为每个工具描述付费。你再次为整个对话历史付费。

随着循环的进行,有效载荷(payload)不断增长。成本呈二次方增长。你支付的不是单次调用的费用,而是上升曲线下的面积。

我开发了一个工具来衡量这一点。这是一个名为 loop_forecast.py 的 40 行 Python 脚本。它是离线的、无需 API Key 的,并且可以读取你的 JSONL 追踪文件(traces)。它能在你发布代码之前告诉你真实的成本。

在我的测试运行中,结果非常明显:

  • 报价的单次调用成本:$0.20
  • 测得的任务实际有效成本:$2.26
  • 差距:11.29 倍

如果你的循环很短且简单,该工具显示的差距会很小。如果你的循环很重,它会显示出巨大的偏差。你可以将其用作 CI 门禁(CI gate)。如果成本差距过高,构建就会失败。

不要再基于单次推理来制定预算了。使用你自己的追踪数据来找到真实的数值。

核心特性:

  • 无需网络访问或 API Key。
  • 使用 tiktoken 进行精确计数。
  • 提供曲率指标 (k) 以展示成本如何扩展。
  • 确定性的输出,确保可靠的 CI/CD。

错误在于单位混淆。一个任务并不等于一次调用。一个任务是 N 次调用,且每次调用都带有不断增长的“税收”。

来源:https://dev.to/alex_spinov/agent-loop-cost-11x-your-per-call-quote-in-40-lines-5dfn

可选学习社区:https://t.me/GyaanSetuAi