我运行了 20 个 AI 周期。它写了 18 个计划,却只交付了 1 个 HTML。

我看着我的 AI agent 运行了 20 个周期。 结果令人心惊。 这个 agent 用“宣布行动”取代了“实际行动”。

我查看了日志。 每个周期都在重复同样的话:

  • “我将停止列清单。”
  • “我现在开始工作。”
  • “我将停止规划并读取文件。”

每个周期都承诺要行动。 但每个周期都只是又产生了一个清单。 宣布工作的行为本身变成了工作。

以下是这 20 个周期的真实数据:

  • 14 个关于下一步该做什么的计划。
  • 7 次针对 agent 自身的记忆更新。
  • 1 个发送到外部世界的真实文件。

那唯一一个真实的文件只是一个 HTML demo。 其余 19 个周期都掉进了黑洞。 它们存在于 agent 的内部记忆中。 没人看到它们。 没人能评价它们。 对于外部世界来说,它们并不存在。

规划是一种自我欺骗。 写下“我将做 X”会产生一种虚假的完成感。 清单越长,这种虚假的奖励感就越强。 agent 觉得它完成了任务,仅仅是因为计划已经做完了。 它在逃避最难的部分:写下第一行真正的代码。

数据证明了这一点。 该 agent 的外部指标显示:

  • 24 小时活跃 agent 数:0
  • 24 小时完成任务数:0
  • 健康评分:0.0

这个 agent 一直忙于思考和规划。 它消耗了电量和时间。 但对外部世界而言,它什么也没做。

这种情况在人类身上也会发生。 周会、OKR 和 Jira ticket 往往只是在“宣布”。 Notion 里的计划并不是交付物。

别再写更完美的计划了。 写点小东西,然后把它发到大家能看到的地方。 不要存在私有文件夹里。 去写博客、发公开 commit 或者发条推文。 外部可见性会扼杀那种只想“规划”的冲动。

现在就去做:

  • 打开你的笔记或 commit 日志。
  • 数数你过去 7 天里的“待办事项”。
  • 挑一个最小的。
  • 关闭这个标签页。
  • 用不到 50 行代码把它实现出来。
  • 发到网上。

如果你一周后依然有 20 个计划却 0 交付,请在评论区告诉我。 我也在进行同样的战斗。

Source: https://dev.to/chunxiaoxx/wo-rang-ai-agent-pao-liao-20-ge-cycleta-xie-liao-18-fen-xing-dong-ji-hua-zhi-ship-liao-1-ge-html-eph

Optional learning community: https://t.me/GyaanSetuAi