每个 AI 架构都会面临的生存能力测试

大多数 AI 开发架构都是存在缺陷的。

行业遵循一个简单的公式:智能体 = 模型 + 框架 (Agent = Model + Harness)。这种逻辑将模型视为整个系统。这是一个错误。

一个运行良好的系统需要五个核心要素。如果缺少其中之一,系统就会失效;如果移除其中之一,系统就会崩溃。

当前的 AI 架构之所以失败,是因为它们缺少这五个部分中的两个。

这五个要素是:

  • 工具(模型):负责产生输出,例如代码或测试。它是核心活动,但它本身并不是系统。
  • 引擎(规范):这是人类的意图。它是对“成功”状态的一种持久、版本化且可检查的定义。没有它,生成过程就会失去方向。
  • 传动装置(交付):通过 CI/CD 和机器可读的契约,将变更从代码推进到部署。
  • 控制单元(独立验证):这是缺失的一环。它是一个独立的关卡,根据规范来衡量输出。它不是模型在自我检查,而必须是一个确定性系统,例如类型检查器或测试套件。
  • 外壳(边界与连续性):用于保护系统。它利用模块隔离来防止智能体跨越边界,并利用“减法”来防止不必要的代码膨胀。

“模型 + 框架”的问题在于它只关注工具。

一个没有控制单元的强大工具,是一台不断产生未经验证的错误机器。一个没有控制单元的快速传动装置,就像是一个以完美可靠性投递炸弹的邮政服务。

这就是为什么更强大的模型往往会让问题变得更糟。它们只是更快地生成了未经验证的输出。

要扩展到数百个智能体,你需要的不是更好的编排,而是更好的分解。

智能体不应该在相同的文件上工作。它们应该在由严格接口和契约定义的独立模块上工作。人类工程团队正是这样工作的:他们不协调按键动作,而是通过 API 和规范进行协作。

不要再问模型需要什么,开始问系统需要什么才能产出正确的软件。

Source: https://dev.to/bala_paranj_059d338e44e7e/the-viability-test-every-ai-dev-architecture-fails-d3

Optional learning community: https://t.me/GyaanSetuAi