FastContext:将搜索与解决任务分离
代码智能体(Coding agents)在寻找代码上浪费了太多时间。
微软和上海交通大学研究了这个问题。他们发现,搜索代码占用了 56.2% 的工具调用轮次,并消耗了 46.5% 的总 Token。
当单个模型同时进行代码搜索和修复时,其记忆会变得混乱。记忆中充斥着无用的文件片段和失败的猜测,这增加了推理的难度。
FastContext 解决了这个问题。它使用一个独立的子智能体(subagent)来进行代码库探索。
工作原理: • 探索智能体负责寻找正确的文件和行号。 • 它不会向主智能体发送冗长的摘要。 • 它仅发送一小部分精确的证据。 • 主智能体可以专注于修复 Bug。
这种设计带来了两大优势:
- 噪声更少。主智能体不会看到每一个死胡同。
- 效率更高。较小的模型(4B 到 30B 参数)就能有效地处理搜索任务。
结果显而易见。将 FastContext 与 Mini-SWE-Agent 结合使用,使任务成功率提升了 5.5%,同时将 Token 使用量减少了 60%。
构建智能体的经验教训:
- 将搜索视为核心任务,而非辅助步骤。
- 发送文件路径和行号,而不是完整的聊天历史。
- 训练模型为下一个模型提供结构化数据。
- 像关注成功率一样密切关注 Token 使用量。
不要强迫一个模型完成所有工作。一个专门负责搜索的专家会让解决任务的模型变得更快、更可靠。
Optional learning community: https://t.me/GyaanSetuAi