我的 AI Agent 瓶颈不在于模型，而在于架构。

Translated for your language. 阅读原文.

AI-assisted draft.

GyaanSetu Editorial20小时前2分钟阅读

三个月前，一个客户的工作流崩溃了。

我使用一个 agent 来处理文档分类、打标签和摘要。每天处理 50 份文档时表现良好。但当处理量达到 500 份时，问题出现了。

每个批次需要 40 分钟。它无法扩展，最终崩溃了。

我没有更换更大的模型。相反，我将 agent 拆分为三个专业角色。这些角色并行运行。

吞吐量从 40 分钟缩短到了 4 分钟。模型没变，改变的是架构。

大多数开发者都会犯一个错误：构建顺序执行的 agent。即由一个 agent 按顺序完成所有任务。

如果你有 500 份文档，每份文档有三个任务，你就会连续进行 1,500 次 LLM 调用。即使每次调用只需 2 秒，你也需要等待 50 分钟。你的模型大部分时间都在等待。

解决方法是使用并发运行的专业化 agent。

专业化 agent 更快且更便宜。在特定任务上，带有精简 prompt 的小模型会胜过大型通用模型。

然而，不要将所有内容都并行化。要避免以下错误：

遵循以下步骤进行扩展：

构建 AI agent 涉及两个不同的问题。一个是 agent 做什么，另一个是 agent 如何融入你的系统。

生产系统的成败取决于第二个问题。

如果你遇到了瓶颈，不要只是购买更大的模型。先画出你的系统图。你可能会发现架构才是真正的问题所在。

Optional learning community: https://t.me/GyaanSetuAi

继续阅读