𝗠𝗶𝗰𝗿𝗼𝘀𝗼𝗳𝘁 𝗙𝗮𝘀𝘁𝗖𝗼𝗻𝘁𝗲𝘅 𝗖𝘂𝘁𝘀 𝗖𝗼𝗱𝗶𝗻𝗴 𝗔𝗴𝗲𝗻𝘁 𝗧𝗼𝗸𝗲𝗻𝘀 𝗯𝘆 𝟲𝟬%
コーディングエージェントは、コードの探索にあまりにも多くの時間を費やしています。
エージェントがリポジトリを検索する際、多くの場合、すべてのファイルを自身のコンテキストウィンドウに取り込んでしまいます。これにより、エージェントがコーディングを開始する前に、「デスク」が生のデータで埋め尽くされてしまいます。
Microsoftの研究者がGPT-5.4のトレースを調査したところ、重大な問題が判明しました。
- コードの検索と読み取りが、全ツール使用量の56.2%を占めていた。
- メインエージェントの総トークンの46.5%を消費していた。
これらのデータの大部分は、有用な情報(シグナル)が少ないものです。エージェントが必要としているのはわずか数行ですが、ファイル全体を読み込んでしまいます。
Microsoftはこの問題を解決するためにFastContextをリリースしました。
メインエージェントが自ら検索を行う代わりに、専用のexplorerサブエージェントを使用します。これは司書のようなものだと考えてください。あなたはデスクに座ったまま、司書を書庫に送り込んで情報を探してもらうのです。
仕組み:
- メインエージェントが自然言語のクエリをexplorerに送信する。
- explorerはRead、Glob、Grepなどの読み取り専用ツールを使用する。
- explorerは自身の独立したコンテキスト内でコードを見つける。
- ファイル全体を返送する代わりに、「ファイル行の引用(file-line citation)」を送信する。
- 引用は次のような形式になります:path/to/file.ts:88-104
メインエージェントは、膨大なテキストを読み込むことなく、正確な場所を特定できます。
その結果は極めて顕著です:
- トークン使用量を最大60%削減。
- タスク解決率を最大5.5%向上。
explorerモデル(4B-30B)は、2つのトレーニング段階を経ます。まず、教師あり微調整(supervised fine-tuning)によって探索方法を学習させます。次に、タスクに基づいた強化学習(task-grounded reinforcement learning)により、メインエージェントの問題解決に実際に役立つ証拠を見つけられるようにします。
「干し草の山(膨大なデータ)」をサブエージェントに肩代わりさせることで、メインエージェントは実際の推論やコーディングのためにコンテキストウィンドウをクリーンな状態に保つことができます。
Optional learning community: https://t.me/GyaanSetuAi