AI Agent 到底适合谁?
“AI agent”这个术语对不同的人有不同的含义。你与 agent 的关系取决于你的角色。这些角色之间的鸿沟在商业中造成了巨大的问题。
产品是为错误的人开发的。董事会设定的预期是工程师无法实现的。用户得到了他们无法理解的工具。
以下是不同角色如何看待 AI agent:
普通用户 他们希望工具像电灯开关一样即开即用。他们不在乎模型或记忆,只在乎任务能否在第一次尝试时就完成。他们主要的担忧是 agent 做了他们没要求的事情。
折腾者 他们使用自定义提示词 (prompts) 和自动化工具。他们在受控环境中构建完美运行的系统。当 agent 给出自信但错误的答案,或者 API 变更破坏了他们的工作流时,他们会感到很棘手。
高管 他们关注 agent 能释放什么价值,例如提高工作效率或降低成本。他们经常在了解技术是否真正可行之前,就向投资者做出承诺。这给下游的每个技术团队都带来了压力。
QA 工程师 他们需要可复现性和对“正确”的清晰定义。Agent 让这变得很难。输出每次都在变化,且失败往往过于微妙,传统的测试难以捕捉。
IT 团队 他们承担部署的责任。他们面临诸如“随机性退化 (stochastic degradation)”之类的问题,即模型在没有明确错误代码的情况下表现不佳。他们需要目前尚不存在的文档。
DBA 他们管理为 agent 提供数据的环节。他们面临着管理向量存储 (vector stores) 和跟踪检索索引 (retrieval index) 过时程度等新问题。他们通常比其他人更早发现数据错误。
开发者 他们必须既是工程师,又是提示词编写者。调试 (Debugging) 是最难的部分。对于错误的模型响应,并没有堆栈跟踪 (stack trace) 可供参考。解决一个问题可能会产生三个新问题。
架构师 他们将 agent 视为一个由边界和依赖关系构成的系统。他们必须决定组件之间如何通信,以防止整个系统崩溃。
技术本身不是主要问题。问题在于这些人之间的鸿沟。他们都在使用同一个工具,但对于工具应该做什么,或者在失败时由谁负责,他们之间并没有沟通。
到底什么是 AI Agent?用户类型实战指南
“AI Agent”这个词现在到处都是。但对于不同的用户来说,它到底意味着什么?
如果你只是在 ChatGPT 中输入一个提示词,你是在使用 Agent 吗?如果你在使用 AutoGPT,你是在使用 Agent 吗?
为了理清这个概念,我们需要从用户如何与 AI 交互的角度来看待它。
工具 vs. Agent
在深入探讨用户类型之前,我们需要区分两个核心概念:工具 (Tool) 和 Agent。
- 工具 (Tool): 你告诉它做什么,它就做什么。它没有自主性。你给它一个指令,它执行,然后等待下一个指令。例如:计算器、搜索引擎、或者简单的翻译插件。
- Agent: 你告诉它一个目标 (Goal),它会思考如何实现这个目标,拆解步骤,并自主决定下一步该做什么。它具有一定的自主性 (Autonomy)。
用户类型频谱
根据用户在交互中所承担的角色以及对 AI 代理能力的期望,我们可以将用户分为以下几类:
1. 操作员 (The Operator)
交互模式:指令式 (Command-based)
操作员将 AI 视为一种高级工具。他们提供明确的、一步步的指令。
- 目标: 完成特定的、具体的任务。
- 控制权: 完全掌握。用户决定每一步。
- AI 的角色: 一个极其高效的执行者。
- 例子: “请把这段文字翻译成法语”、“帮我总结这篇文章的三个要点”。
2. 指导者 (The Director)
交互模式:目标导向型 (Goal-oriented)
指导者不再提供具体的步骤,而是提供目标和约束条件。他们管理着 Agent 的工作流。
- 目标: 实现一个复杂的项目或流程。
- 控制权: 策略性控制。用户决定“做什么”和“遵循什么规则”,而 Agent 决定“怎么做”。
- AI 的角色: 一个可以被委派任务的初级员工或助手。
- 例子: “帮我调研一下 2024 年电动汽车市场的趋势,并写一份报告,要求包含数据图表和竞争对手分析。”
3. 架构师 (The Architect)
交互模式:系统构建型 (System-building)
架构师不直接与单个 Agent 交互,而是设计 Agent 的运行环境、工具集和工作流。
- 目标: 创建一个能够自主运行的系统。
- 控制权: 结构性控制。用户设计 Agent 的逻辑框架、权限和工具。
- AI 的角色: 系统中的核心组件。
- 例子: 使用 LangChain 或 CrewAI 构建一个自动化的客户支持系统,该系统可以自动读取邮件、查询数据库并回复用户。
总结
理解 AI Agent 的关键在于理解自主性 (Autonomy) 的程度。
- 如果你是在使用它,你可能是一个操作员。
- 如果你是在委派它,你可能是一个指导者。
- 如果你是在构建它,你就是一个架构师。
随着技术的发展,这三个角色之间的界限正在变得模糊,但区分它们对于开发出真正符合用户需求的 AI 产品至关重要。
Optional learning community: https://t.me/GyaanSetuAi