El costo de verificación es el verdadero costo de la programación con IA

Translated for your language. Leer el original.

AI-assisted draft.

GyaanSetu Editorialhace 6 días2min de lectura

El costo de verificación es el verdadero costo de la programación con IA

Solía hacer una pregunta al elegir un modelo de IA para programar.

¿Qué modelo es lo suficientemente potente para esta tarea?

Esa pregunta está bien. Pero ya no es mi primera pregunta.

La mejor pregunta es: ¿Qué tan rápido puedo verificar el resultado?

Esta mentalidad cambia la forma en que utilizas los modelos de bajo costo. No los veas como versiones débiles de los modelos grandes. Vélos como trabajadores para tareas con rutas de verificación cortas.

Algunas tareas son baratas de revisar porque puedes ver los resultados de inmediato.

• Limpieza de README • Ejemplos de uso • Comentarios de código • Notas del changelog • Pequeños scripts de formato • Plantillas de issues

Si un modelo escribe un mal párrafo en el README, lo notarás. Borras la parte incorrecta. El error es molesto, pero no te cuesta casi nada. Este es el mejor uso para los modelos económicos.

La siguiente categoría es el trabajo que se puede probar.

Si puedes definir el comportamiento esperado y ejecutar una suite de pruebas, utiliza un modelo más económico para el primer borrador. Debes darle al modelo límites claros.

No digas: Añade pruebas para esta función auxiliar.

Di: Añade pruebas para entrada vacía, entrada nula, valores duplicados, configuración inválida, configuración por defecto y entrada normal. No cambies el código de ejecución (runtime).

Esto obliga al modelo a trabajar dentro de un marco de verificación.

Algunas tareas carecen de pruebas automatizadas pero permiten comprobaciones manuales claras.

• Formateo de la salida de la CLI • Ejemplos de configuración • Notas de ejecución de prueba (dry run) de migración • Pequeños scripts de conversión de datos

Para estas, pide al modelo que incluya:

Cómo ejecutar el código
Qué entrada utilizar
Qué resultado esperar
Qué casos límite (edge cases) comprobar

Si un modelo no puede explicar cómo verificar su propio trabajo, no confíes en el código.

Las refactorizaciones pequeñas son peligrosas. Un diff puede parecer corto y limpio. Pero el comportamiento podría cambiar en una ruta oculta, un valor por defecto o una comprobación de permisos.

Aumenta tu nivel de riesgo cuando una tarea afecte a:

Fallbacks
Valores por defecto
Enrutamiento
Permisos
Facturación
Rate limits
Migraciones
Compatibilidad con versiones anteriores

Estos errores son difíciles de ver en una revisión de código estándar. Requieren un contexto profundo.

Organiza tu trabajo según el costo de verificación:

Bajo costo de verificación: Usa un modelo de bajo costo para el borrador.
Costo de verificación medio: Usa un modelo de bajo costo y luego realiza ediciones humanas.
Alto costo de verificación: Usa un modelo potente con pruebas y revisión humana.

El tamaño no importa. Una tarea pequeña es costosa si es difícil de verificar.

La parte costosa de la programación con IA no es la generación. Es la confianza.

Fuente: https://dev.to/zephyrelabs369/verification-cost-is-the-real-ai-coding-cost-1354

Comunidad de aprendizaje opcional: https://t.me/GyaanSetuAi

El costo de verificación es el verdadero costo de la programación con IA

El costo de verificación es el verdadero costo de la programación con IA

Seguir leyendo

Una escalera de verificación para modelos de codificación de IA de bajo costo

Programación de calidad de vanguardia a un costo económico