循环工程:设计循环,而非仅仅编写提示词
停止手动为编程智能体编写提示词。开始设计能够自动为它们编写提示词的循环。
Peter Steinberger 的这一观点改变了 AI 开发者的对话。他认为,程序员应该从“驾驶员”转变为“系统设计者”。
什么是循环工程?
它是从逐条输入提示词转向编写管理智能体的程序。不再由你亲自完成工作,而是由一个循环来处理逻辑。
循环执行以下步骤:
- 选择一个任务。
- 将任务发送给智能体。
- 检查结果。
- 决定继续还是停止。
循环在你睡觉时也能运转。
每个循环的 4 步循环:
- 行动 (Act):智能体编写代码或运行命令。
- 观察 (Observe):系统读取输出、错误日志或测试结果。
- 推理 (Reason):系统评估是否达到了目标。
- 重复 (Repeat):如果失败,则让智能体重新尝试。
手动提示 vs. 循环工程:
- 手动:你是引擎。你必须坐在屏幕前。你需要阅读每一个 diff。
- 循环:循环是引擎。它自动运行。它 24/7 全天候工作。
成功的核心支柱:
一个好的循环需要三样东西:
- 验证器 (Verifier):用于检查工作是否真正正确的工具。不要让智能体检查自己的工作。请使用真实的测试和 linter。
- 状态管理 (State Management):跟踪已完成和待处理的任务。
- 成本控制 (Cost Control):设置 token 数量和重试次数的限制。
需要警惕的风险:
- 虚假完成 (False Completion):智能体声称已完成,但 bug 依然存在。通过强大的验证器来解决这个问题。
- 速度过载 (Speed Overload):循环在你睡觉时写了 1,000 行代码。你可能要花一整天的时间来试图理解它。
- 过度依赖 (Over-reliance):因为连续十次看起来都很完美,你就停止检查工作了。对于关键任务,务必保持“人在回路”(human in the loop)。
如何开始:
- 从小规模开始。构建一个简单的循环,不断重试提示词直到测试通过。
- 投资于验证器。将现有的测试套件作为循环的“眼睛”。
- 限制损害。使用 git 分支并设置最大重试限制。
- 在低风险任务上实践。在转向生产代码之前,先将循环用于文档编写或代码重构。
手动提示词的时代正在结束。循环工程的时代已经到来。
Optional learning community: https://t.me/GyaanSetuAi
