构建 AI 专业知识的窗口正在关闭
人们谈论 AI 演示(demo)和生产系统时,仿佛它们是同一回事。其实不然。
在华丽的演示与能在现实世界中运行的系统之间,存在着巨大的鸿沟。
每个人都把一切都称为“智能体”(agent)。一个带有记忆的聊天机器人是智能体,一个带有循环的脚本也是智能体。这是错误的。这种错误会导致糟糕的工程实践。
你最终会过度设计简单的任务,而对复杂的任务设计不足。
真正的定义如下:一个智能体拥有目标。它决定下一步行动。它能处理失败。它知道任务何时结束。除此之外的一切都仅仅是函数调用。
如何区分: • 如果每一步都需要人类引导,那它只是一个聊天界面。 • 如果系统能从失败的工具调用中恢复,它就是一个智能体。 • 如果系统能将目标分解为子任务,它就是一个真正的智能体。
成功的团队不仅仅是在追逐新模型。他们专注于三件事:
- 工具设计:接口有多简洁?
- 失败处理:当工具返回空结果时会发生什么?
- 可观测性:智能体为什么做出那个决定?
你使用的框架并不如你遵循的模式重要。LangChain 或 CrewAI 仅仅是工具。架构才是关键。
使用这些模式:
- 先计划后执行:使用一个步骤进行计划,使用另一个独立的步骤进行行动。
- 将检索与推理分离:获取数据和使用数据是不同的工作。
- 明确的任务移交:当一个智能体将工作传递给另一个智能体时,使用结构化日志。
RAG 也在引发问题。大多数人在分块(chunking)上失败了。如果你的分块切断了上下文,模型就会产生幻觉。在责怪模型之前,你必须先修复你的分块和元数据。
模型会变得更好,Token 会变得更便宜。但这并不能解决工程挑战。
真正的挑战是构建可以信任的系统。你需要治理机制和可靠的工具使用能力。
两年后真正重要的工程师不是提示词工程师(prompt engineers),而是系统设计者。他们构建的是其他人可以维护的 AI。
Optional learning community: https://t.me/GyaanSetuAi
