Mi agente de programación con IA no paraba de fallar — Lo que cambié

Hace seis semanas, mi agente de programación con IA producía basura.

Escribía funciones que compilaban pero no hacían nada. Superaba las pruebas por las razones equivocadas. Corregía un error pero creaba tres nuevos.

Pensé que el problema era el agente. Me equivoqué. El problema era mi propia falta de disciplina.

Utilizo un agente de IA para el 40% de mi trabajo de ingeniería. Se encarga de refactorizaciones, generación de pruebas e investigación de errores. Cuando mi base de código era desordenada, la IA triplicaba ese desorden.

La IA no reemplaza la disciplina. Amplifica lo que ya tienes.

Así es como cambié mi flujo de trabajo para mejorar los resultados:

  • Las pruebas deben validar el comportamiento, no el estado. Deja de escribir pruebas como "assert user is not None". Eso es una mentira. Una prueba debe verificar datos específicos como "assert user.email == expected_email". Si la prueba es débil, la IA se aprovechará de ello.

  • Lee cada uno de los diffs. Solía aceptar refactorizaciones sin mirar el código. Esto provocaba dependencias circulares y una arquitectura desordenada. Si no puedes explicar por qué un cambio es mejor, recházalo.

  • Haz que el estado sea explícito. No dejes que la IA "deduzca" cómo manejar cachés o sesiones. Defínelos en tus prompts o esquemas. El estado inferido provoca errores silenciosos que tumban el entorno de producción.

  • Escribe tus propias pruebas para los cambios del agente. Cada vez que el agente cambia el código, primero escribo una prueba redactada por un humano. Esto cuesta 15 minutos, pero ahorra horas de depuración.

  • Exige fallos evidentes. Si un cambio supera las pruebas pero rompe la lógica, el sistema debe señalarlo. Nunca aceptes "las pruebas pasan, envíalo" como una métrica válida.

Los resultados:

  • Los errores por semana bajaron de 5 a menos de 1.
  • El tiempo de depuración bajó de 6 horas a 1 hora por semana.

El agente no cambió. Yo cambié.

Si usas agentes de IA, primero arregla tu base de código. Mejora tus pruebas, clarifica tu estado y endurece tus revisiones.

El agente es un espejo. Asegúrate de tener algo que valga la pena amplificar.

Fuente: https://dev.to/susiloharjo/my-ai-coding-agent-kept-breaking-what-i-changed-4l5f

Comunidad de aprendizaje opcional: https://t.me/GyaanSetuAi