向 AI 提问 vs. 向 AI Agent 委派任务

大多数开发者将 AI 当作更智能版的 Stack Overflow。

你输入问题,得到答案,然后自己动手完成工作。这种方法效率很低。

有一种更快捷的方法。你必须停止单纯的提问,开始学会委派任务。

当你向 AI 提问时: “如何为我的 auth 模块编写测试?” 你会得到一个解释。但你仍然需要自己编写测试,自己动手完成工作。

当你向 AI Agent 委派任务时: “为 /src/auth.py 编写测试。覆盖登录、登出和无效 token 的情况。运行测试。如果失败,请修复代码直到通过。告诉我你修改了什么。”

Agent 会打开你的文件,编写测试,运行测试,读取失败信息,修复代码,最后为你交付一套可运行的测试套件。

你只需审查结果。工作不是你做的。

有效的委派需要包含四个部分:

  • 目标:Agent 应该产出什么?
  • 范围:它应该涉及哪些文件或区域?
  • 成功标准:我们如何知道它完成得正确?
  • 反馈报告:它修改了什么,为什么要修改?

实际案例:

调试: “找出此错误及其堆栈跟踪的根本原因。修复它并解释故障点。”

重构: “重构此文件。嵌套层级最多不超过两层。函数长度不超过 30 行。更新所有调用点。”

数据库迁移: “为此次 schema 变更编写一个幂等的迁移脚本。在本地数据库上运行以确认成功。”

代码审查: “阅读此 PR diff。找出任何可能在生产环境中出错的地方。编写我遗漏的测试。”

Agent 速度很快,但有时也会出错。使用以下三个检查步骤来验证它们的工作:

  1. 它解决问题了吗? 运行代码,而不仅仅是阅读它。执行测试。运行代码是发现边缘情况失败的唯一方法。

  2. 它符合你的代码库规范吗? Agent 并不知道你们团队的约定。扫描输出结果,检查是否存在异常模式或你们团队避用的库。

  3. 它是否修改了范围之外的内容? 检查 Agent 触碰了哪些文件。像审查初级开发者的 PR 一样阅读 diff。确保它在提供帮助的同时没有破坏原有功能。

你的工作重心从“执行工作”转向了“定义目标”和“审查结果”。你提供判断力,Agent 提供速度。

Source: https://dev.to/omerberatsezer/asking-vs-delegating-agents-43ii

Optional learning community: https://t.me/GyaanSetuAi