智能体循环成本：是单次调用报价的 11 倍

Translated for your language. 阅读原文.

AI-assisted draft.

Agent 循环成本：是单次调用报价的 11 倍

大多数团队在为 AI Agent 制定预算时，只看单次调用的成本。他们看到每百万 token 的价格，然后以此估算单个动作的成本。这种方法是错误的。

Agent 循环的成本并不等同于单次调用。它的成本要高得多。

原因很简单。每当 Agent 进行工具调用（tool call）时，它都会重新发送整个上下文。你再次为系统提示词（system prompt）付费。你再次为每个工具描述付费。你再次为整个对话历史付费。

随着循环的进行，有效载荷（payload）不断增长。成本呈二次方增长。你支付的不是单次调用的费用，而是上升曲线下的面积。

我开发了一个工具来衡量这一点。这是一个名为 loop_forecast.py 的 40 行 Python 脚本。它是离线的、无需 API Key 的，并且可以读取你的 JSONL 追踪文件（traces）。它能在你发布代码之前告诉你真实的成本。

在我的测试运行中，结果非常明显：

如果你的循环很短且简单，该工具显示的差距会很小。如果你的循环很重，它会显示出巨大的偏差。你可以将其用作 CI 门禁（CI gate）。如果成本差距过高，构建就会失败。

不要再基于单次推理来制定预算了。使用你自己的追踪数据来找到真实的数值。

核心特性：

错误在于单位混淆。一个任务并不等于一次调用。一个任务是 N 次调用，且每次调用都带有不断增长的“税收”。

继续阅读