Dentro de un Agente de IA
Las demostraciones de agentes de IA se ven geniales en los videos. A menudo fallan cuando se les hacen preguntas reales.
El agente hace lo incorrecto. Olvida decisiones. Llama a herramientas que no existen. Entra en bucles infinitos. Estos no son fallos del modelo. Son fallos del flujo de trabajo.
Un agente es un flujo de trabajo de software. Un modelo de lenguaje elige el siguiente paso y llama a las herramientas. La inteligencia reside en la orquestación, no solo en el modelo.
Cada agente de producción se basa en cinco pilares:
- Planificación: Pensar antes de actuar.
- Uso de herramientas: Interactuar con el mundo.
- Memoria: Almacenar contexto y hechos.
- Restricciones: Establecer límites y presupuestos.
- Verificación: Demostrar que el trabajo es correcto.
Estilos de Planificación
Los agentes ingenuos pasan directamente a la acción. Esto provoca alucinaciones. Un buen agente planifica primero.
- Plan-then-execute (Planificar y luego ejecutar): El modelo escribe un plan completo. Es fácil de auditar pero difícil de adaptar si la realidad cambia.
- ReAct (Reason + Act): El modelo piensa, actúa y observa en un bucle. Es más adaptativo pero cuesta más en tokens y tiempo.
Uso de herramientas
Sin herramientas, un agente es solo un chatbot. Una herramienta necesita un nombre, un esquema JSON y una función.
Los modelos eligen herramientas basándose en descripciones. Si tu descripción es vaga, el agente fallará. Trata las descripciones como hojas de especificaciones. Define para qué sirve una herramienta y para qué no.
Valida siempre las llamadas a las herramientas. Si un modelo envía argumentos incorrectos, rechaza la llamada y devuelve el error al modelo. Esto ayuda al agente a aprender durante el bucle.
Memoria
La memoria no es una sola cosa.
- Memoria de trabajo: La conversación actual y los resultados de las herramientas.
- Scratchpad: Un lugar para que el agente se escriba notas a sí mismo.
- Memoria a largo plazo: Almacenar hechos para sesiones futuras.
No dependas únicamente de bases de datos vectoriales. La memoria basada en archivos mediante archivos markdown suele ser mejor. Es fácil de auditar, editar y buscar con grep.
Restricciones y Seguridad
Los agentes de producción necesitan salvaguardas. Utiliza estas cuatro:
- Listas de permitidos de herramientas (allowlists): Permitir solo herramientas específicas y con nombre.
- Presupuestos de iteración: Limitar el número de pasos para evitar bucles infinitos.
- Presupuestos de tokens: Limitar los costes estableciendo un tope de tokens totales.
- Puertas de aprobación: Requerir permiso humano para acciones críticas como enviar correos electrónicos o eliminar datos.
Verificación
Nunca confíes en un modelo cuando diga que una tarea está terminada. El modelo es seguro de sí mismo por defecto.
Utiliza una verificación real. Si un agente escribe código, ejecuta las pruebas. Si genera JSON, comprueba el esquema. Si realiza una tarea, ejecuta una consulta para confirmar el cambio.
Los mejores agentes utilizan la verificación dentro del bucle. Si una prueba falla, devuelve el error al agente. Deja que lo intente de nuevo.
Deja de perseguir prompts más inteligentes. Empieza a construir una mejor infraestructura.
Comunidad de aprendizaje opcional: https://t.me/GyaanSetuAi
