为什么大多数 AI 智能体都过度设计了
AI 智能体无处不在。你会看到智能体集群 (agent swarms)、自主团队和自我改进系统。每周都有新的框架承诺构建下一代 AI。
在研究了 AI 工作流后,我得出了一个简单的结论:大多数 AI 智能体都过度设计了。
智能体并非无用。然而,许多开发者在可以用更简单的方法解决问题时,却选择了用智能体来解决。
行业热衷于复杂化
想象一下,你想构建一个读取 PDF、提取数据并回答问题的系统。许多开发者会创建一个包含六个智能体、多个提示词 (prompts) 和状态管理 (state management) 的复杂架构。这会带来很多麻烦。
同样的问题通常可以通过一个简单的序列来解决:
- PDF 转分块 (Chunk)
- 分块转嵌入 (Embed)
- 嵌入转向量数据库 (Vector DB)
- LLM 转响应 (Response)
有时一个工作流就足够了。你不需要一支“智能体军队”。
工作流能解决大多数问题
大多数 AI 应用是确定性的 (deterministic)。它们遵循一套固定的序列。例如:
- 文档问答 (Document Q&A)
- 客户支持
- 会议摘要
- 博客生成
- 代码审查 (Code review)
这些是工作流,而不是自主系统。工作流更容易调试、扩展、维护和解释。
智能体会引入隐藏成本
每个新智能体都会增加问题:
- 更多的提示词导致更高的 Token 成本
- 额外的步骤导致更高的延迟 (latency)
- 更多的幻觉 (hallucinations) 风险
- 更难调试
- 更多的基础设施需求
一个简单的应用变成了一个庞大的工程项目。
智能体真正发挥作用的场景
我并不反对智能体。在以下情况下,智能体非常有用:
- 任务运行时间较长,例如研究多个网站。
- 需要基于特定逻辑进行决策。
- 人类干预是闭环的一部分 (human intervention is part of the loop)。
- 必须让 Slack、GitHub 和电子邮件等多个工具协作。
我的准则
开发者往往直接跳进复杂的框架中。在那样做之前,问自己一个问题:工作流能解决这个问题吗?
如果答案是肯定的,那就从工作流开始。只有当复杂度确实需要时,才添加智能体。
遵循这个原则:
- 工作流优先。
- 智能体其次。
- 多智能体最后。
复杂并不代表创新。复杂意味着成本。用户并不关心你使用了多少个智能体,他们只关心工具是否好用。简单本身就是一种特性。
Source: https://dev.to/jaideepparashar/why-i-think-most-ai-agents-are-overengineered-249o