Todo el mundo habla de prompts. El bucle es donde los agentes realmente fallan
La ingeniería de prompts acapara toda la atención. La gente comparte prompts y se siente inteligente. Pero en los sistemas agénticos que construyo, los prompts no fallan. El bucle es lo que falla.
Un agente no es un simple prompt y respuesta. Es un bucle.
- Observar el estado.
- Realizar una acción.
- Evaluar el resultado.
- Decidir si continuar o detenerse.
Si uno de estos pasos falla, el agente falla. Analicé 12 modelos en 1,412 ejecuciones para estudiar esto. Aquí te explico cómo fallan los bucles y cómo solucionarlos.
Fallos comunes en el bucle:
- Espirales de tokens: El agente se repite y consume demasiados tokens.
- Puntos ciegos: El agente no puede ver su entorno y repite el mismo error.
- Éxito falso: El agente produce una respuesta incorrecta pero cree que es correcta.
- Callejones sin salida: El agente encuentra un error pero no puede usar esos datos para mejorar.
Un mejor prompt no puede solucionar estos problemas. Necesitas ingeniería de bucles.
Cuatro principios de diseño para mejores bucles:
- Limitar el bucle: Establecer un límite estricto de iteraciones y tokens. Si el agente alcanza un tope, debe detenerse y pedir ayuda.
- Hacer que el entorno sea legible: Asegurarse de que el paso de observación proporcione al agente todos los hechos. Si un agente repite una acción fallida, es porque le falta la información adecuada.
- Separar al actor del evaluador: No permitas que el mismo modelo revise su propio trabajo. Utiliza un modelo diferente o una comprobación basada en reglas para juzgar la salida.
- Cerrar el bucle: Utilizar los errores para impulsar correcciones reales. Cuando un bucle falle, añade una prueba de regresión para que no vuelva a suceder.
Construí un agente de soporte llamado RelayOps siguiendo estas reglas. Utilizamos un juez independiente para calificar al agente.
En una ocasión, el agente citó el artículo correcto pero no logró responder a la pregunta real. Una simple comprobación basada en reglas lo aprobó. Pero nuestro evaluador independiente lo detectó. Utilizamos ese fallo para arreglar el sistema y añadimos una prueba para evitar que volviera a ocurrir.
El agente no necesitaba ser más inteligente. El bucle necesitaba estar mejor diseñado.
Deja de centrarte solo en los prompts. Céntrate en la estructura.
¿Qué fallo de bucle has visto? ¿Una espiral de tokens, un punto ciego o un agente que estaba erróneamente seguro de sí mismo?
Comunidad de aprendizaje opcional: https://t.me/GyaanSetuAi