La anatomía de un arnés de agentes
Construiste un chatbot. Añadiste algunas herramientas y un bucle simple. Funciona para una demostración. Luego intentas pasar a producción y todo se rompe.
El modelo olvida los pasos anteriores. Las llamadas a herramientas fallan sin previo aviso. La ventana de contexto se llena de datos inútiles.
El problema no es tu modelo. El problema es la infraestructura que lo rodea.
Esta infraestructura se llama arnés de agentes (agent harness).
El agente es el comportamiento. El arnés es la maquinaria. Si no eres el modelo, eres el arnés.
Piensa en un LLM puro como una CPU. No tiene RAM, ni disco, ni E/S. El arnés es el sistema operativo. Proporciona la memoria, las herramientas y la lógica para que el modelo sea útil.
Un arnés de nivel de producción tiene doce componentes principales:
• Bucle de orquestación: Este es el latido. Gestiona el ciclo Pensamiento-Acción-Observación. • Capa de herramientas: Estas son las manos. El arnés se encarga del registro, la validación y la ejecución de las herramientas. • Memoria: Incluye el historial a corto plazo y la persistencia a largo plazo a través de las sesiones. • Gestión de contexto: Esto evita la degradación del contexto mediante la compactación o el resumen de datos. • Ensamblaje de prompts: Construye la entrada exacta que el modelo ve en cada paso. • Clasificación de salida: Decide si el modelo quiere hablar o usar una herramienta. • Gestión de estado: Permite que el agente reanude el trabajo tras un error o interrupción. • Gestión de errores: Captura los fallos para que los errores no se acumulen. • Guardrails: Actúan como sensores de activación para detener acciones inseguras o incorrectas. • Aplicación de permisos: Separa lo que un modelo quiere hacer de lo que tiene permitido hacer. • Bucles de verificación: Permiten que el modelo compruebe su propio trabajo para mejorar la calidad. • Transferencia de agentes: Gestiona cómo un agente pasa el trabajo a otro.
El objetivo de una buena ingeniería es mantener el arnés lo más ligero posible. A medida que los modelos se vuelven más inteligentes, necesitarás menos andamiaje.
Cuando tu agente falle, no culpes al modelo. Mira tu arnés.
Fuente: https://dev.to/aniruddhaadak/the-anatomy-of-an-agent-harness-1n1j
Comunidad de aprendizaje opcional: https://t.me/GyaanSetuAi
