为什么大多数 AI 智能体都过度设计了

AI 智能体无处不在。你会看到智能体集群 (agent swarms)、自主团队和自我改进系统。每周都有新的框架承诺构建下一代 AI。

在研究了 AI 工作流后,我得出了一个简单的结论:大多数 AI 智能体都过度设计了。

智能体并非无用。然而,许多开发者在可以用更简单的方法解决问题时,却选择了用智能体来解决。

行业热衷于复杂化

想象一下,你想构建一个读取 PDF、提取数据并回答问题的系统。许多开发者会创建一个包含六个智能体、多个提示词 (prompts) 和状态管理 (state management) 的复杂架构。这会带来很多麻烦。

同样的问题通常可以通过一个简单的序列来解决:

  • PDF 转分块 (Chunk)
  • 分块转嵌入 (Embed)
  • 嵌入转向量数据库 (Vector DB)
  • LLM 转响应 (Response)

有时一个工作流就足够了。你不需要一支“智能体军队”。

工作流能解决大多数问题

大多数 AI 应用是确定性的 (deterministic)。它们遵循一套固定的序列。例如:

  • 文档问答 (Document Q&A)
  • 客户支持
  • 会议摘要
  • 博客生成
  • 代码审查 (Code review)

这些是工作流,而不是自主系统。工作流更容易调试、扩展、维护和解释。

智能体会引入隐藏成本

每个新智能体都会增加问题:

  • 更多的提示词导致更高的 Token 成本
  • 额外的步骤导致更高的延迟 (latency)
  • 更多的幻觉 (hallucinations) 风险
  • 更难调试
  • 更多的基础设施需求

一个简单的应用变成了一个庞大的工程项目。

智能体真正发挥作用的场景

我并不反对智能体。在以下情况下,智能体非常有用:

  • 任务运行时间较长,例如研究多个网站。
  • 需要基于特定逻辑进行决策。
  • 人类干预是闭环的一部分 (human intervention is part of the loop)。
  • 必须让 Slack、GitHub 和电子邮件等多个工具协作。

我的准则

开发者往往直接跳进复杂的框架中。在那样做之前,问自己一个问题:工作流能解决这个问题吗?

如果答案是肯定的,那就从工作流开始。只有当复杂度确实需要时,才添加智能体。

遵循这个原则:

  • 工作流优先。
  • 智能体其次。
  • 多智能体最后。

复杂并不代表创新。复杂意味着成本。用户并不关心你使用了多少个智能体,他们只关心工具是否好用。简单本身就是一种特性。

Source: https://dev.to/jaideepparashar/why-i-think-most-ai-agents-are-overengineered-249o