向 AI 提问 vs. 向 AI Agent 委派任务
大多数开发者将 AI 当作更智能版的 Stack Overflow。
你输入问题,得到答案,然后自己动手完成工作。这种方法效率很低。
有一种更快捷的方法。你必须停止单纯的提问,开始学会委派任务。
当你向 AI 提问时: “如何为我的 auth 模块编写测试?” 你会得到一个解释。但你仍然需要自己编写测试,自己动手完成工作。
当你向 AI Agent 委派任务时: “为 /src/auth.py 编写测试。覆盖登录、登出和无效 token 的情况。运行测试。如果失败,请修复代码直到通过。告诉我你修改了什么。”
Agent 会打开你的文件,编写测试,运行测试,读取失败信息,修复代码,最后为你交付一套可运行的测试套件。
你只需审查结果。工作不是你做的。
有效的委派需要包含四个部分:
- 目标:Agent 应该产出什么?
- 范围:它应该涉及哪些文件或区域?
- 成功标准:我们如何知道它完成得正确?
- 反馈报告:它修改了什么,为什么要修改?
实际案例:
调试: “找出此错误及其堆栈跟踪的根本原因。修复它并解释故障点。”
重构: “重构此文件。嵌套层级最多不超过两层。函数长度不超过 30 行。更新所有调用点。”
数据库迁移: “为此次 schema 变更编写一个幂等的迁移脚本。在本地数据库上运行以确认成功。”
代码审查: “阅读此 PR diff。找出任何可能在生产环境中出错的地方。编写我遗漏的测试。”
Agent 速度很快,但有时也会出错。使用以下三个检查步骤来验证它们的工作:
它解决问题了吗? 运行代码,而不仅仅是阅读它。执行测试。运行代码是发现边缘情况失败的唯一方法。
它符合你的代码库规范吗? Agent 并不知道你们团队的约定。扫描输出结果,检查是否存在异常模式或你们团队避用的库。
它是否修改了范围之外的内容? 检查 Agent 触碰了哪些文件。像审查初级开发者的 PR 一样阅读 diff。确保它在提供帮助的同时没有破坏原有功能。
你的工作重心从“执行工作”转向了“定义目标”和“审查结果”。你提供判断力,Agent 提供速度。
Source: https://dev.to/omerberatsezer/asking-vs-delegating-agents-43ii
Optional learning community: https://t.me/GyaanSetuAi
