当前最火的 AI 框架存在一个致命缺陷
现在每个人都把一切都称为“智能体”(agent)。
调用工具的函数是智能体。带有记忆的聊天机器人是智能体。带有循环的脚本是智能体。这是一个错误。
当你缺乏清晰的定义时,你会过度设计简单的任务,而对复杂的任务设计不足。我看到很多团队在只需要一个优秀提示词(prompt)的工作流上,花费数周时间进行智能体编排(agentic orchestration)。
智能体需要的是目标,而不仅仅是指令。智能体决定下一步做什么。它能处理失败。它知道何时完成任务。
- 如果人类告诉系统每一步该怎么做,那它只是一个聊天界面。
- 如果系统能从失败的工具调用中恢复,说明你正在取得进展。
- 如果系统能将目标分解为子任务,那才是真正的智能体。
大多数成功的智能体都是垂直领域的。它们擅长做一件事。比如处理客户支持或文档提取。它们不是通用的推理引擎。
成功的团队专注于以下三个领域:
- 工具设计:接口有多简洁?
- 错误处理:当工具返回空结果时会发生什么?
- 可观测性:你能追踪智能体做出决策的原因吗?
那些只更换模型而不改变架构,却期望获得更好结果的团队将会失败。
像 LangChain 或 CrewAI 这样的框架,其重要性远不如模式(patterns)。无论使用什么工具,模式都是通用的。
使用这些模式:
- 先规划后执行:使用一个步骤进行规划,使用另一个独立的步骤进行执行。
- 将检索与推理分离:获取数据和使用数据是两项不同的工作。
- 明确的任务移交:当一个智能体将工作传递给另一个智能体时,请使用结构化日志。
框架是脚手架。架构才是建筑本身。
RAG 也是失败的根源之一。大多数人的分块(chunking)方式都是错误的。如果你对文档的分块处理不当,模型就会丢失上下文。
如果你的 RAG 返回的结果正确但毫无用处,请修复你的分块方式或元数据(metadata)。不要责怪嵌入模型(embedding model)。
停止盲目追求基准测试(benchmarks)。专注于构建你可以信任的系统。专注于治理、可观测性和可靠的工具使用。
真正重要的工程师是那些能够构建出他人可以维护的系统的人。这是系统设计,而不是模型研究。
Source: https://dev.to/aibughunter/the-hottest-ai-framework-right-now-has-a-fatal-flaw-nobody-mentions-3hd1
Optional learning community: https://t.me/GyaanSetuAi