AI 驱动的成绩通胀:为何高分可能意味着学习不足
生成式 AI 在学术界的快速融合正推动学生成绩大幅飙升,但最新研究表明,这一趋势反映的是“外包劳动”而非认知能力的提升。随着 A 等级分布的整体上移,教育工作者和行业领袖正警告称,即将到来的“技能萎缩”可能会导致学术凭证与实际能力脱节。
成绩飙升背后的数据
研究员 Igor Chirikov 进行的一项全面研究追踪了 2018 年至 2025 年间 84 个系的 319 门课程,揭示了学业表现中一个令人震惊的趋势。自 2022 年 11 月 ChatGPT 发布以来,A 等级的占比跃升了 13 个百分点——比 2022 年的基准线高出约 30%。这一转变导致平均 GPA 上升了 0.12 分,并显著缩小了整体成绩分布的差距。
研究强调,这种通胀在不同学科之间并不均衡。相反,在“AI 接触度”较高的课程中最为明显——特别是那些包含大量写作和编程作业的课程。有趣的是,数据显示 A-(A 减)和 B+ 等级经常被“提拔”为纯 A 等级,这表明评估过程中存在系统性的向上漂移。
家庭作业 vs. 监考考试:确凿的证据
该研究最关键的发现在于这些成绩增长发生的领域。如果 AI 确实增强了学习效果,那么成绩的提升应该在所有评估类型中都可见。然而,数据表明成绩通胀与非监督性作业之间存在明显的关联。
在家庭作业占最终成绩权重高于中位数的课程中,与具有相似 AI 接触度但作业权重较低的课程相比,A 等级的比例额外上升了 16 个百分点。相反,在依赖监考考试或口头报告(AI 的效用显著较低的领域)的课程中,成绩保持稳定。这表明,成绩激增是学生利用 AI 完成非监督任务的直接结果,而非教学成果的真实体现。
学术信号功能与批判性思维的侵蚀
几十年来,成绩通胀一直是哈佛大学等机构关注的问题,其 A 等级占比从 2005 年的 24% 上升到 2025 年的 60% 以上。然而,Chirikov 认为 AI 引入了一个本质上不同的问题。以往的通胀驱动因素发生在评分阶段,而 AI 改变了“生产”阶段,在教师看到作业之前就改变了作品的创作方式。
这为更广泛的技术和专业领域带来了两大风险:
- 凭证贬值: 如果编程和写作密集型课程的成绩反映的是 AI 的输出而非人类的技能,雇主和研究生项目将难以做出准确的选拔决策。
- 技能萎缩: OpenAI 首席执行官 Sam Altman 曾警告称,如果没有系统性的教育变革,批判性思维技能面临“严重萎缩”的风险。如果学生将训练大脑的任务(如写作和编程)外包出去,他们毕业时可能缺乏掌握所用工具所需的底层逻辑。
核心要点
- 与非监督性工作的关联: 成绩通胀在家庭作业权重较高的课程中最为剧烈,这表明 AI 正被用于绕过学习,而非增强学习。
- 特定的脆弱领域: 由于 LLM 在这些领域的极高熟练度,写作和编程密集的课程面临着最高的“外包式”成绩通胀风险。
- 信号危机: 这种转变威胁到学术成绩与实际技能水平的挂钩,可能导致劳动力市场缺乏解决复杂问题所需的底层批判性思维能力。