Microsoft FastContex reduce en un 60% los tokens de los agentes de programación

📅3 hours ago⏱1 min read

Microsoft FastContext reduce los tokens de los agentes de programación en un 60%

Los agentes de programación pierden demasiado tiempo buscando código.

Cuando un agente busca en un repositorio, a menudo carga cada archivo en su propia ventana de contexto. Esto llena el "escritorio" de datos brutos antes de que el agente siquiera comience a programar.

Investigadores de Microsoft estudiaron los rastros de GPT-5.4 y encontraron un problema masivo:

Buscar y leer código representó el 56,2% de todo el uso de herramientas.
Consumió el 46,5% del total de tokens del agente principal.

La mayor parte de estos datos tiene una baja señal. El agente solo necesita unas pocas líneas, pero carga con el archivo completo.

Microsoft lanzó FastContext para solucionar esto.

En lugar de que el agente principal realice la búsqueda, utiliza un subagente explorador dedicado. Piénsalo como un bibliotecario: tú te quedas en tu escritorio y envías a un bibliotecario a las estanterías para encontrar información.

Cómo funciona:

El agente principal envía una consulta en lenguaje natural al explorador.
El explorador utiliza herramientas de solo lectura como Read, Glob y Grep.
El explorador encuentra el código en su propio contexto separado.
En lugar de devolver el archivo completo, envía una "citación de archivo y línea".
Una citación se ve así: path/to/file.ts:88-104.

El agente principal obtiene la ubicación exacta sin el texto voluminoso.

Los resultados son significativos:

Reducción de hasta un 60% en el uso de tokens.
Aumento de hasta un 5,5% en las tasas de resolución de tareas.

El modelo explorador (4B-30B) se somete a dos etapas de entrenamiento. Primero, el ajuste fino supervisado (supervised fine-tuning) le enseña cómo explorar. Segundo, el aprendizaje por refuerzo basado en tareas (task-grounded reinforcement learning) garantiza que encuentre evidencia que realmente ayude al agente principal a resolver el problema.

Al delegar el "pajar" a un subagente, el agente principal mantiene su ventana de contexto limpia para el razonamiento y la programación reales.

Fuente: https://dev.to/pueding/microsoft-fastcontext-a-repo-explorer-subagent-cuts-coding-agent-tokens-60-explorer-subagent-2lpk

Comunidad de aprendizaje opcional: https://t.me/GyaanSetuAi

Microsoft FastContex reduce en un 60% los tokens de los agentes de programación

Continue reading

𝗧𝗛𝗘 𝗡𝗘𝗫𝗧 𝗔𝗜 𝗖𝗢𝗗𝗜𝗡𝗚 𝗕𝗢𝗧𝗧𝗟𝗘𝗡𝗘𝗖𝗞 𝗜𝗦 𝗥𝗘𝗣𝗢 𝗨𝗡𝗗𝗘𝗥𝗦𝗧𝗔𝗡𝗗𝗜𝗡𝗚

El secreto sucio de MCP: Tu agente está quemando tokens

El impuesto al contexto MCP

Ingeniería de contexto para ingenieros de prompts

Cuando las ventanas de contexto dejan de importar