智能体循环的兴起:AI 自主性的下一个前沿
人工智能的演进正迅速从静态代码生成转向动态、自维持的生态系统。随着开发者从编写代码转向使用智能体(agents),行业正进入“循环”(loops)时代——即智能体通过提示(prompt)其他智能体来执行持续的、迭代的工作。
从源代码到智能体集群
在 Meta 的 @Scale 大会上,Claude Code 的创造者 Boris Cherny 强调了 AI 开发生命周期中的一次深刻转变。如果说上一个重大里程碑是从手动编写源代码转向 AI 编写代码,那么 Cherny 认为,下一个飞跃同样意义重大:即向“智能体管理其他智能体”的转变。
这不仅仅是理论上的;Cherny 描述了一种专门的智能体在持续循环中运行的工作流。例如,一个智能体可能专门负责优化代码架构,而另一个智能体则负责扫描并统一重复的抽象。这些智能体的运作方式类似于人类工程师,会提交拉取请求(pull requests)并进行异步工作。与传统的自动化不同,这些循环是非确定性的;子智能体不是遵循硬编码的退出条件,而是利用推理能力来决定任务何时达到了足够的优化程度或已完成。
理解循环逻辑与推理时计算
“循环”的概念借鉴了基础计算机科学——特别是递归函数——但增加了一层概率推理。一个显著的模式是“Ralph Loop”(以《辛普森一家》中的角色 Ralph Wiggum 命名),这是一种用于防止模型在执行长任务期间发生“漂移”的技术。模型会总结自身的进度并评估是否达到了目标,本质上是在逻辑中不断“回弹”,直到取得成功的结果。
这一趋势与“推理时计算”(test-time compute)的概念密切相关。正如 OpenAI 研究员 Noam Brown 所指出的,如果提供充足的计算资源,当代模型可以解决日益复杂的问题。在“爬山”(hill-climbing)场景中——例如对代码库进行增量改进——循环允许 AI 对问题进行持续迭代,通过投入更多计算资源来压榨出更高的性能,直到达到特定的阈值。
经济现实:Token 消耗与价值的博弈
虽然智能体循环的技术潜力令人惊叹,但其经济影响也十分重大。与标准的问答式聊天机器人交互不同,智能体循环旨在后台无休止地运行。这会导致 Token 消耗量激增,从而使企业的成本大幅攀升。
对于 Anthropic 等 AI 提供商而言,这代表了一种高增长的营收模式。然而,对于开发者和创始人来说,实现循环需要进行精细的平衡。在这个新领域取得成功的关键,在于实施严格的监督以管理“漂移”(即 AI 偏离了原始目标),并针对 Token 支出建立严格的护栏(guardrails),以确保循环产生的价值超过其运营成本。
核心要点
- 自主性的转变: AI 正在从单轮代码生成转向自主的智能体循环,其中智能体相互监督并相互提示。
- 推理时计算: 智能体循环利用推理阶段增加的计算量,来解决复杂的、迭代式的“爬山”问题。
- 成本管理至关重要: 这些循环的持续性可能导致 Token 消耗呈指数级增长,因此,对于企业级应用而言,监督机制和预算护栏是必不可少的。
