真正能够交付的 Agent
Agent 的炒作周期有一个明确的答案。那些在生产环境中通过 Agent 取得成功的团队并不构建自主集群。他们构建的是“无聊”的系统。
我观察了一个月生产环境中的实际运作情况。模式非常清晰。那些能赚钱或节省时间的 Agent 并没有无休止的循环。它们是可观测的,是受限的,并且在需要时会请求人工帮助。
这改变了你评估 Agent 平台的方式。
在生产环境中使用 Agent 的团队依赖于:
- 手动构建 Prompt
- 开箱即用的模型
- 在人工干预前步骤不超过 10 步的受限执行
这就是工程纪律。
Demo 展示的是具有完全自主能力的自我修正 Agent。而真正能够交付的 Agent 看起来不同。它们使用显式的闸门。
客服 Agent 处理 5 个步骤后就会转人工。编程 Agent 会运行测试,但在未经审核的情况下不会合并代码。数据 Agent 在运行查询前会请求批准。这些是行之有效的架构选择。
成功的 Agent 解决的是狭窄且可重复的问题。它们处理退货、分拣工单或标记合规问题。范围窄意味着故障可预测,且更易于调试。
交付 Agent 最难的部分不是让它们变得更聪明,而是让它们变得可见且可控。
团队经常失败的原因在于:
- 当 Agent 失败时,无法解释其行为
