Microsoft FastContext reduce los tokens de los agentes de programación en un 60%

Los agentes de programación pierden demasiado tiempo buscando código.

Cuando un agente busca en un repositorio, a menudo carga cada archivo en su propia ventana de contexto. Esto llena el "escritorio" de datos brutos antes de que el agente siquiera comience a programar.

Investigadores de Microsoft estudiaron los rastros de GPT-5.4 y encontraron un problema masivo:

La mayor parte de estos datos tiene una baja señal. El agente solo necesita unas pocas líneas, pero carga con el archivo completo.

Microsoft lanzó FastContext para solucionar esto.

En lugar de que el agente principal realice la búsqueda, utiliza un subagente explorador dedicado. Piénsalo como un bibliotecario: tú te quedas en tu escritorio y envías a un bibliotecario a las estanterías para encontrar información.

Cómo funciona:

El agente principal obtiene la ubicación exacta sin el texto voluminoso.

Los resultados son significativos:

El modelo explorador (4B-30B) se somete a dos etapas de entrenamiento. Primero, el ajuste fino supervisado (supervised fine-tuning) le enseña cómo explorar. Segundo, el aprendizaje por refuerzo basado en tareas (task-grounded reinforcement learning) garantiza que encuentre evidencia que realmente ayude al agente principal a resolver el problema.

Al delegar el "pajar" a un subagente, el agente principal mantiene su ventana de contexto limpia para el razonamiento y la programación reales.

Fuente: https://dev.to/pueding/microsoft-fastcontext-a-repo-explorer-subagent-cuts-coding-agent-tokens-60-explorer-subagent-2lpk

Comunidad de aprendizaje opcional: https://t.me/GyaanSetuAi