Microsoft FastContext reduziert Token für Coding-Agenten um 60 %
Coding-Agenten verschwenden zu viel Zeit mit der Suche nach Code.
Wenn ein Agent ein Repository durchsucht, lädt er oft jede Datei in sein eigenes Kontextfenster. Dies füllt den „Schreibtisch“ mit Rohdaten, noch bevor der Agent überhaupt mit dem Codieren beginnt.
Microsoft-Forscher untersuchten GPT-5.4-Traces und fanden ein massives Problem:
- Das Suchen und Lesen von Code nahm 56,2 % aller Werkzeugnutzungen ein.
- Es verbrauchte 46,5 % der gesamten Token des Hauptagenten.
Die meisten dieser Daten haben einen geringen Informationsgehalt. Der Agent benötigt nur wenige Zeilen, schleppt aber die gesamte Datei mit sich herum.
Microsoft hat FastContext veröffentlicht, um dieses Problem zu lösen.
Anstatt dass der Hauptagent die Suche selbst durchführt, nutzt er einen dedizierten Explorer-Subagenten. Stellen Sie sich das wie einen Bibliothekar vor. Sie bleiben an Ihrem Schreibtisch und schicken einen Bibliothekar in die Regale, um Informationen zu finden.
So funktioniert es:
- Der Hauptagent sendet eine Anfrage in natürlicher Sprache an den Explorer.
- Der Explorer nutzt Read-only-Tools wie Read, Glob und Grep.
- Der Explorer findet den Code in seinem eigenen, separaten Kontext.
- Anstatt die gesamte Datei zurückzusenden, sendet er eine „Datei-Zeilen-Zitation“ (file-line citation).
- Eine Zitation sieht so aus: path/to/file.ts:88-104.
Der Hauptagent erhält die genaue Position ohne den sperrigen Text.
Die Ergebnisse sind signifikant:
- Bis zu 60 % Reduzierung des Token-Verbrauchs.
- Bis zu 5,5 % Steigerung der Aufgabenlösungsrate.
Das Explorer-Modell (4B-30B) durchläuft zwei Trainingsphasen. Erstens lehrt es Supervised Fine-Tuning, wie man exploriert. Zweitens stellt Task-grounded Reinforcement Learning sicher, dass es Belege findet, die dem Hauptagenten tatsächlich helfen, das Problem zu lösen.
Indem die Suche nach der „Nadel im Heuhaufen“ auf einen Subagenten ausgelagert wird, hält der Hauptagent sein Kontextfenster sauber für das eigentliche Reasoning und Codieren.
Optionale Lern-Community: https://t.me/GyaanSetuAi