FastContext:将搜索与解决任务分离

代码智能体(Coding agents)在寻找代码上浪费了太多时间。

微软和上海交通大学研究了这个问题。他们发现,搜索代码占用了 56.2% 的工具调用轮次,并消耗了 46.5% 的总 Token。

当单个模型同时进行代码搜索和修复时,其记忆会变得混乱。记忆中充斥着无用的文件片段和失败的猜测,这增加了推理的难度。

FastContext 解决了这个问题。它使用一个独立的子智能体(subagent)来进行代码库探索。

工作原理: • 探索智能体负责寻找正确的文件和行号。 • 它不会向主智能体发送冗长的摘要。 • 它仅发送一小部分精确的证据。 • 主智能体可以专注于修复 Bug。

这种设计带来了两大优势:

  1. 噪声更少。主智能体不会看到每一个死胡同。
  2. 效率更高。较小的模型(4B 到 30B 参数)就能有效地处理搜索任务。

结果显而易见。将 FastContext 与 Mini-SWE-Agent 结合使用,使任务成功率提升了 5.5%,同时将 Token 使用量减少了 60%。

构建智能体的经验教训:

  • 将搜索视为核心任务,而非辅助步骤。
  • 发送文件路径和行号,而不是完整的聊天历史。
  • 训练模型为下一个模型提供结构化数据。
  • 像关注成功率一样密切关注 Token 使用量。

不要强迫一个模型完成所有工作。一个专门负责搜索的专家会让解决任务的模型变得更快、更可靠。

Source: https://dev.to/prabhakar_chaudhary_7afe4/fastcontext-why-coding-agents-benefit-from-a-separate-repository-explorer-3gen

Optional learning community: https://t.me/GyaanSetuAi