AI Agent 到底适合谁？

Machine-translated. Read the original.

📅2 hours ago⏱2 min read

In this article

AI Agent 到底适合谁？

“AI agent”这个术语对不同的人有不同的含义。你与 agent 的关系取决于你的角色。这些角色之间的鸿沟在商业中造成了巨大的问题。

产品是为错误的人开发的。董事会设定的预期是工程师无法实现的。用户得到了他们无法理解的工具。

以下是不同角色如何看待 AI agent：

普通用户 他们希望工具像电灯开关一样即开即用。他们不在乎模型或记忆，只在乎任务能否在第一次尝试时就完成。他们主要的担忧是 agent 做了他们没要求的事情。
折腾者 他们使用自定义提示词 (prompts) 和自动化工具。他们在受控环境中构建完美运行的系统。当 agent 给出自信但错误的答案，或者 API 变更破坏了他们的工作流时，他们会感到很棘手。
高管他们关注 agent 能释放什么价值，例如提高工作效率或降低成本。他们经常在了解技术是否真正可行之前，就向投资者做出承诺。这给下游的每个技术团队都带来了压力。
QA 工程师 他们需要可复现性和对“正确”的清晰定义。Agent 让这变得很难。输出每次都在变化，且失败往往过于微妙，传统的测试难以捕捉。
IT 团队 他们承担部署的责任。他们面临诸如“随机性退化 (stochastic degradation)”之类的问题，即模型在没有明确错误代码的情况下表现不佳。他们需要目前尚不存在的文档。
DBA 他们管理为 agent 提供数据的环节。他们面临着管理向量存储 (vector stores) 和跟踪检索索引 (retrieval index) 过时程度等新问题。他们通常比其他人更早发现数据错误。
开发者 他们必须既是工程师，又是提示词编写者。调试 (Debugging) 是最难的部分。对于错误的模型响应，并没有堆栈跟踪 (stack trace) 可供参考。解决一个问题可能会产生三个新问题。
架构师 他们将 agent 视为一个由边界和依赖关系构成的系统。他们必须决定组件之间如何通信，以防止整个系统崩溃。

技术本身不是主要问题。问题在于这些人之间的鸿沟。他们都在使用同一个工具，但对于工具应该做什么，或者在失败时由谁负责，他们之间并没有沟通。

到底什么是 AI Agent？用户类型实战指南

“AI Agent”这个词现在到处都是。但对于不同的用户来说，它到底意味着什么？

如果你只是在 ChatGPT 中输入一个提示词，你是在使用 Agent 吗？如果你在使用 AutoGPT，你是在使用 Agent 吗？

为了理清这个概念，我们需要从用户如何与 AI 交互的角度来看待它。

工具 vs. Agent

在深入探讨用户类型之前，我们需要区分两个核心概念：工具 (Tool) 和 Agent。

工具 (Tool): 你告诉它做什么，它就做什么。它没有自主性。你给它一个指令，它执行，然后等待下一个指令。例如：计算器、搜索引擎、或者简单的翻译插件。
Agent: 你告诉它一个目标 (Goal)，它会思考如何实现这个目标，拆解步骤，并自主决定下一步该做什么。它具有一定的自主性 (Autonomy)。

用户类型频谱

根据用户在交互中所承担的角色以及对 AI 代理能力的期望，我们可以将用户分为以下几类：

1. 操作员 (The Operator)

交互模式：指令式 (Command-based)

操作员将 AI 视为一种高级工具。他们提供明确的、一步步的指令。

目标： 完成特定的、具体的任务。
控制权： 完全掌握。用户决定每一步。
AI 的角色： 一个极其高效的执行者。
例子： “请把这段文字翻译成法语”、“帮我总结这篇文章的三个要点”。

2. 指导者 (The Director)

交互模式：目标导向型 (Goal-oriented)

指导者不再提供具体的步骤，而是提供目标和约束条件。他们管理着 Agent 的工作流。

目标： 实现一个复杂的项目或流程。
控制权： 策略性控制。用户决定“做什么”和“遵循什么规则”，而 Agent 决定“怎么做”。
AI 的角色： 一个可以被委派任务的初级员工或助手。
例子： “帮我调研一下 2024 年电动汽车市场的趋势，并写一份报告，要求包含数据图表和竞争对手分析。”

3. 架构师 (The Architect)

交互模式：系统构建型 (System-building)

架构师不直接与单个 Agent 交互，而是设计 Agent 的运行环境、工具集和工作流。

目标： 创建一个能够自主运行的系统。
控制权： 结构性控制。用户设计 Agent 的逻辑框架、权限和工具。
AI 的角色： 系统中的核心组件。
例子： 使用 LangChain 或 CrewAI 构建一个自动化的客户支持系统，该系统可以自动读取邮件、查询数据库并回复用户。

总结

理解 AI Agent 的关键在于理解自主性 (Autonomy) 的程度。

如果你是在使用它，你可能是一个操作员。
如果你是在委派它，你可能是一个指导者。
如果你是在构建它，你就是一个架构师。

随着技术的发展，这三个角色之间的界限正在变得模糊，但区分它们对于开发出真正符合用户需求的 AI 产品至关重要。

Optional learning community: https://t.me/GyaanSetuAi