Microsoft FastContext reduce los tokens de los agentes de programación en un 60%
Los agentes de programación pierden demasiado tiempo buscando código.
Cuando un agente busca en un repositorio, a menudo carga cada archivo en su propia ventana de contexto. Esto llena el "escritorio" de datos brutos antes de que el agente siquiera comience a programar.
Investigadores de Microsoft estudiaron los rastros de GPT-5.4 y encontraron un problema masivo:
- Buscar y leer código representó el 56,2% de todo el uso de herramientas.
- Consumió el 46,5% del total de tokens del agente principal.
La mayor parte de estos datos tiene una baja señal. El agente solo necesita unas pocas líneas, pero carga con el archivo completo.
Microsoft lanzó FastContext para solucionar esto.
En lugar de que el agente principal realice la búsqueda, utiliza un subagente explorador dedicado. Piénsalo como un bibliotecario: tú te quedas en tu escritorio y envías a un bibliotecario a las estanterías para encontrar información.
Cómo funciona:
- El agente principal envía una consulta en lenguaje natural al explorador.
- El explorador utiliza herramientas de solo lectura como Read, Glob y Grep.
- El explorador encuentra el código en su propio contexto separado.
- En lugar de devolver el archivo completo, envía una "citación de archivo y línea".
- Una citación se ve así: path/to/file.ts:88-104.
El agente principal obtiene la ubicación exacta sin el texto voluminoso.
Los resultados son significativos:
- Reducción de hasta un 60% en el uso de tokens.
- Aumento de hasta un 5,5% en las tasas de resolución de tareas.
El modelo explorador (4B-30B) se somete a dos etapas de entrenamiento. Primero, el ajuste fino supervisado (supervised fine-tuning) le enseña cómo explorar. Segundo, el aprendizaje por refuerzo basado en tareas (task-grounded reinforcement learning) garantiza que encuentre evidencia que realmente ayude al agente principal a resolver el problema.
Al delegar el "pajar" a un subagente, el agente principal mantiene su ventana de contexto limpia para el razonamiento y la programación reales.
Comunidad de aprendizaje opcional: https://t.me/GyaanSetuAi