Revisión de código por IA por niveles: un marco de trabajo para PR generados por IA
Las herramientas de IA cambian la forma en que el código llega a tu cola de revisión. Los diffs son más grandes y rápidos. A menudo provienen de la IA en lugar del pensamiento humano.
Esto no es un problema a menos que tu proceso de revisión siga siendo el mismo.
Las investigaciones muestran que las herramientas de codificación con IA pueden aumentar la rotación de código (code churn) y disminuir la reutilización. Un estudio encontró que el código generado por IA suele tener más vulnerabilidades de seguridad que el código humano.
Las herramientas de IA ayudan a los equipos a lanzar productos más rápido. Pero tratar cada pull request de IA de la misma manera que uno humano crea cuellos de botella o defectos ocultos.
Necesitas un enfoque por niveles. Ajusta tu esfuerzo de revisión al riesgo del cambio.
Utiliza estas tres señales para decidir el nivel de revisión:
• Origen del código: ¿Utilizó un humano una pequeña sugerencia de la IA o redactó una IA toda la funcionalidad? El código de IA a menudo parece correcto pero carece de una lógica profunda. • Alcance del cambio: ¿Cuántas líneas cambiaron? Los diffs grandes tienen una mayor superficie de exposición a errores. • Radio de impacto (Blast Radius): ¿Qué toca el código? Los cambios en la autenticación o los pagos son de alto riesgo. Los cambios en la documentación son de bajo riesgo.
Asigna niveles basándote en estas señales:
• Nivel 1 (Lectura rápida): Úsalo para código realizado únicamente por humanos o scripts pequeños asistidos por IA. Un revisor verifica que no haya claves codificadas (hardcoded keys). Tiempo de respuesta: 4 horas. • Nivel 2 (Escrutinio): Úsalo para cambios moderados de IA o diffs humanos más grandes. Un revisor verifica la lógica y la cobertura de pruebas. Tiempo de respuesta: 24 horas. • Nivel 3 (Aprobación final): Úsalo para cualquier código crítico o diffs grandes generados por IA. Dos revisores, incluido un líder técnico, deben dar su aprobación. Los escaneos de seguridad y los planes de reversión (rollback) son obligatorios. Tiempo de respuesta: 48 horas.
El radio de impacto es tu criterio de anulación. Un cambio diminuto de IA en tu lógica de pagos es siempre Nivel 3.
Puedes automatizar esto. Utiliza un flujo de trabajo de GitHub Actions para leer el tamaño de los diffs y las rutas de los archivos. Asigna etiquetas como review/tier-1 o review/tier-3 automáticamente.
Este sistema no es un castigo. Es una forma de asegurar que los humanos adecuados presten la atención adecuada al código adecuado.
Construye la matriz. Añade las etiquetas. Utiliza los datos para ajustar tus umbrales con el tiempo.
Fuente: https://dev.to/vuong_ngo/tiered-ai-code-review-a-framework-for-ai-generated-prs-4fgb
Comunidad de aprendizaje opcional: https://t.me/GyaanSetuAi