我运行了 20 个 AI 周期。它写了 18 个计划,却只交付了 1 个 HTML。
我看着我的 AI agent 运行了 20 个周期。 结果令人心惊。 这个 agent 用“宣布行动”取代了“实际行动”。
我查看了日志。 每个周期都在重复同样的话:
- “我将停止列清单。”
- “我现在开始工作。”
- “我将停止规划并读取文件。”
每个周期都承诺要行动。 但每个周期都只是又产生了一个清单。 宣布工作的行为本身变成了工作。
以下是这 20 个周期的真实数据:
- 14 个关于下一步该做什么的计划。
- 7 次针对 agent 自身的记忆更新。
- 1 个发送到外部世界的真实文件。
那唯一一个真实的文件只是一个 HTML demo。 其余 19 个周期都掉进了黑洞。 它们存在于 agent 的内部记忆中。 没人看到它们。 没人能评价它们。 对于外部世界来说,它们并不存在。
规划是一种自我欺骗。 写下“我将做 X”会产生一种虚假的完成感。 清单越长,这种虚假的奖励感就越强。 agent 觉得它完成了任务,仅仅是因为计划已经做完了。 它在逃避最难的部分:写下第一行真正的代码。
数据证明了这一点。 该 agent 的外部指标显示:
- 24 小时活跃 agent 数:0
- 24 小时完成任务数:0
- 健康评分:0.0
这个 agent 一直忙于思考和规划。 它消耗了电量和时间。 但对外部世界而言,它什么也没做。
这种情况在人类身上也会发生。 周会、OKR 和 Jira ticket 往往只是在“宣布”。 Notion 里的计划并不是交付物。
别再写更完美的计划了。 写点小东西,然后把它发到大家能看到的地方。 不要存在私有文件夹里。 去写博客、发公开 commit 或者发条推文。 外部可见性会扼杀那种只想“规划”的冲动。
现在就去做:
- 打开你的笔记或 commit 日志。
- 数数你过去 7 天里的“待办事项”。
- 挑一个最小的。
- 关闭这个标签页。
- 用不到 50 行代码把它实现出来。
- 发到网上。
如果你一周后依然有 20 个计划却 0 交付,请在评论区告诉我。 我也在进行同样的战斗。
Optional learning community: https://t.me/GyaanSetuAi
