Inflación de calificaciones impulsada por la IA: Por qué las notas más altas pueden indicar un menor aprendizaje
La rápida integración de la IA generativa en el ámbito académico está provocando un aumento significativo en las calificaciones de los estudiantes, pero nuevas investigaciones sugieren que esta tendencia refleja un trabajo subcontratado en lugar de una mejora en las capacidades cognitivas. A medida que la distribución de las calificaciones tipo A se desplaza hacia arriba, educadores y líderes de la industria advierten sobre una inminente "atrofia de habilidades" que podría desacoplar las credenciales académicas de la competencia real.
Los datos detrás del aumento de las calificaciones
Un estudio exhaustivo realizado por el investigador Igor Chirikov, que realizó un seguimiento de 319 cursos en 84 departamentos desde 2018 hasta 2025, revela una tendencia sorprendente en el rendimiento académico. Desde el lanzamiento de ChatGPT en noviembre de 2022, la proporción de calificaciones A ha aumentado 13 puntos porcentuales, aproximadamente un 30% por encima de la línea de base de 2022. Este cambio ha provocado que el promedio de calificaciones (GPA) aumente 0,12 puntos y ha estrechado significativamente la distribución general de las notas.
El estudio destaca que esta inflación no es uniforme en todas las disciplinas. En cambio, es más pronunciada en los cursos con una alta "exposición a la IA", específicamente en aquellos con una gran mezcla de tareas de redacción y programación. Curiosamente, los datos muestran que las calificaciones A-minus y B-plus se están "subiendo" con frecuencia a A puras, lo que sugiere una deriva ascendente sistemática en la evaluación.
Tareas frente a exámenes supervisados: La prueba irrefutable
El hallazgo más crítico de la investigación reside en dónde ocurren estos aumentos de calificaciones. Si la IA realmente estuviera mejorando el aprendizaje, las mejoras en las notas serían visibles en todos los tipos de evaluación. Sin embargo, los datos muestran una clara correlación entre la inflación de las calificaciones y las tareas no supervisadas.
En los cursos donde las tareas tienen un peso superior a la mediana de la calificación final, las notas A aumentaron 16 puntos porcentuales adicionales en comparación con los cursos con menos tareas y una exposición similar a la IA. Por el contrario, en los cursos que dependen de exámenes supervisados o presentaciones orales —áreas donde la utilidad de la IA es significativamente menor— las calificaciones se mantuvieron estables. Esto sugiere que el aumento de las notas es un resultado directo de los estudiantes que utilizan la IA para completar tareas no supervisadas, en lugar de ser un reflejo de ganancias pedagógicas genuinas.
La erosión de la señalización académica y el pensamiento crítico
Durante décadas, la inflación de las calificaciones ha sido una preocupación en instituciones como Harvard, donde las notas A aumentaron del 24% en 2005 a más del 60% para 2025. Sin embargo, Chirikov sostiene que la IA introduce un problema fundamentalmente diferente. Mientras que los motores anteriores de la inflación ocurrían durante la etapa de calificación, la IA altera la etapa de producción, cambiando la forma en que se crea el trabajo antes de que un instructor siquiera lo vea.
Esto crea dos riesgos principales para el panorama tecnológico y profesional en general:
- Credenciales devaluadas: Si las calificaciones en cursos con gran carga de programación y redacción reflejan el resultado de la IA en lugar de la habilidad humana, los empleadores y los programas de posgrado tendrán dificultades para tomar decisiones de selección precisas.
- Atrofia de habilidades: El CEO de OpenAI, Sam Altman, ha advertido que, sin cambios educativos sistémicos, las habilidades de pensamiento crítico corren el riesgo de sufrir una "atrofia significativa". Si los estudiantes subcontratan las mismas tareas que entrenan la mente —como la redacción y la programación—, podrían graduarse careciendo de la lógica fundamental necesaria para dominar las herramientas que utilizan.
Conclusiones clave
- Correlación con el trabajo no supervisado: La inflación de las calificaciones es más agresiva en los cursos donde las tareas tienen un peso elevado, lo que sugiere que la IA se está utilizando para eludir, en lugar de aumentar, el aprendizaje.
- Vulnerabilidades específicas: Los planes de estudio con gran carga de redacción y programación corren el mayor riesgo de sufrir una inflación de calificaciones "subcontratada" debido a la alta competencia de los LLM en estos dominios.
- La crisis de señalización: El cambio amenaza con desacoplar las calificaciones académicas de los niveles de habilidad reales, creando potencialmente una fuerza laboral que carece del pensamiento crítico fundamental necesario para la resolución de problemas complejos.