构建 AI 专业知识的窗口正在关闭

人们谈论 AI 演示(demo)和生产系统时,仿佛它们是同一回事。其实不然。

在华丽的演示与能在现实世界中运行的系统之间,存在着巨大的鸿沟。

每个人都把一切都称为“智能体”(agent)。一个带有记忆的聊天机器人是智能体,一个带有循环的脚本也是智能体。这是错误的。这种错误会导致糟糕的工程实践。

你最终会过度设计简单的任务,而对复杂的任务设计不足。

真正的定义如下:一个智能体拥有目标。它决定下一步行动。它能处理失败。它知道任务何时结束。除此之外的一切都仅仅是函数调用。

如何区分: • 如果每一步都需要人类引导,那它只是一个聊天界面。 • 如果系统能从失败的工具调用中恢复,它就是一个智能体。 • 如果系统能将目标分解为子任务,它就是一个真正的智能体。

成功的团队不仅仅是在追逐新模型。他们专注于三件事:

  • 工具设计:接口有多简洁?
  • 失败处理:当工具返回空结果时会发生什么?
  • 可观测性:智能体为什么做出那个决定?

你使用的框架并不如你遵循的模式重要。LangChain 或 CrewAI 仅仅是工具。架构才是关键。

使用这些模式:

  • 先计划后执行:使用一个步骤进行计划,使用另一个独立的步骤进行行动。
  • 将检索与推理分离:获取数据和使用数据是不同的工作。
  • 明确的任务移交:当一个智能体将工作传递给另一个智能体时,使用结构化日志。

RAG 也在引发问题。大多数人在分块(chunking)上失败了。如果你的分块切断了上下文,模型就会产生幻觉。在责怪模型之前,你必须先修复你的分块和元数据。

模型会变得更好,Token 会变得更便宜。但这并不能解决工程挑战。

真正的挑战是构建可以信任的系统。你需要治理机制和可靠的工具使用能力。

两年后真正重要的工程师不是提示词工程师(prompt engineers),而是系统设计者。他们构建的是其他人可以维护的 AI。

Source: https://dev.to/aibughunter/the-window-to-build-ai-expertise-is-closing-faster-than-anyone-expected-3a2c

Optional learning community: https://t.me/GyaanSetuAi