智能体完全按照我的要求做了,而这恰恰就是问题所在
2024 年,AI 编程智能体改变了一切。
它们能阅读你的代码库,遵循你的命名模式,并理解你的业务领域。
我原以为这意味着原本需要两周的任务只需两天就能完成。但我错了。
我给智能体布置了一个大任务:为一款 React Native 应用构建一个全局事件机制。我制定了一个计划,并批准了该计划。
智能体完美地执行了计划。而这正是问题所在。
计划遗漏了关键细节。它没有考虑到条件加载的组件,也没有评估对整个系统的影响。
智能体解决了显而易见的问题,却留下了隐形的隐患。
以下是发生的情况:
• UI 在计划忽略的区域崩溃了。 • 智能体添加了重复的事件处理器。 • 智能体自创了使用 Context 和 Redux 的新模式,而这并非我的要求。
智能体失败并非因为代码写得差,而是因为缺乏约束。
当你没有设定规则时,AI 就会进行猜测。而它的猜测往往是错误的。
我试图通过对话来修复它。我在原有代码之上不断叠加新代码。对话记录变得越来越长。我开始开启新的对话,结果陷入了恶性循环。
到第三天时,代码完成了 75%,但非常脆弱。没有任何记录可以说明哪些部分有效,哪些部分失败了。
我意识到问题不在于工具,而在于角色。
AI 可以写代码,但它无法决定工作的本质是什么。
人工审查是在错误发生后进行纠正。但人类的判断必须在工作开始前定义工作内容。
你需要的不是更好的工具,而是一份契约。
我构建了一个分为七个阶段的工作流。在进入下一个阶段之前,必须由人工批准每一次交接。这确保了工作始终保持在定义的边界之内。
Source: https://dev.to/jeelvankhede/the-agent-did-exactly-what-i-asked-and-that-was-the-problem-1hek
Optional learning community: https://t.me/GyaanSetuAi