我每天晚上都会在我的 Agent 上运行一个自我改进循环
我的 AI agent 以前总是犯同样的错误。它会执行任务,在失败时保持沉默,然后报告一切运行完美。它并没有坏掉,只是没有办法从错误中学习。
我构建了一个自我改进循环来解决这个问题。
每天凌晨 2 点,一个隔离的会话就会启动。它会读取过去 24 小时的日志,找出出错的模式,然后更新 agent 的记忆文件。整个过程无需人工干预。
其工作原理如下:
- 将执行者与评论者分离。主 agent 负责运行任务,而一个独立的会话负责审查工作。一个会话不能既是法官又是执行者。
- 使用简单的文件。我使用纯文本文件进行记忆和修正。这让系统保持轻量化。
- 强制具体化。我不会要求 agent 去“改进”,而是要求它“寻找模式、提供证据并提出一个具体的修复方案”。
我使用三个特定的文件来管理这一切:
- Daily logs(每日日志):发生的一切事物的原始记录。
- Accumulated lessons(累积教训):agent 在每次会话开始时都会阅读的高信号规则。
- Corrections(修正记录):存放近期修复方案的地方。如果一个错误在两周内发生了三次,它就会被移至永久教训文件。
效果并非立竿见影。在前三周,观察到的问题还很显而易见。到了第四周,agent 发现了深层问题。它发现了时序错误以及我在错误信息中忽略的隐藏模式。
最大的好处是稳定性。如果我在修复问题后问题再次出现,我就知道我的修复方案是错误的。系统会跟踪解决方案是否真正有效。
该系统也有局限性。它可以从日志中看到失败,但除非我标记,否则它无法看到判断上的错误。当它出于正确的原因做了错误的事情时,我仍然必须告诉它。
这套设置仅需 50 行配置,运行时间不到两分钟。它让我的 agent 每一天都变得更好一点点。
Optional learning community: https://t.me/GyaanSetuAi