AI驱动的成绩膨胀：为何高分可能意味着学习不足

Translated for your language. 阅读原文.

AI-assisted draft.

本文目录

AI 驱动的成绩通胀：为何高分可能意味着学习不足

生成式 AI 在学术界的快速融合正推动学生成绩大幅飙升，但最新研究表明，这一趋势反映的是“外包劳动”而非认知能力的提升。随着 A 等级分布的整体上移，教育工作者和行业领袖正警告称，即将到来的“技能萎缩”可能会导致学术凭证与实际能力脱节。

成绩飙升背后的数据

研究员 Igor Chirikov 进行的一项全面研究追踪了 2018 年至 2025 年间 84 个系的 319 门课程，揭示了学业表现中一个令人震惊的趋势。自 2022 年 11 月 ChatGPT 发布以来，A 等级的占比跃升了 13 个百分点——比 2022 年的基准线高出约 30%。这一转变导致平均 GPA 上升了 0.12 分，并显著缩小了整体成绩分布的差距。

研究强调，这种通胀在不同学科之间并不均衡。相反，在“AI 接触度”较高的课程中最为明显——特别是那些包含大量写作和编程作业的课程。有趣的是，数据显示 A-（A 减）和 B+ 等级经常被“提拔”为纯 A 等级，这表明评估过程中存在系统性的向上漂移。

家庭作业 vs. 监考考试：确凿的证据

该研究最关键的发现在于这些成绩增长发生的领域。如果 AI 确实增强了学习效果，那么成绩的提升应该在所有评估类型中都可见。然而，数据表明成绩通胀与非监督性作业之间存在明显的关联。

在家庭作业占最终成绩权重高于中位数的课程中，与具有相似 AI 接触度但作业权重较低的课程相比，A 等级的比例额外上升了 16 个百分点。相反，在依赖监考考试或口头报告（AI 的效用显著较低的领域）的课程中，成绩保持稳定。这表明，成绩激增是学生利用 AI 完成非监督任务的直接结果，而非教学成果的真实体现。

学术信号功能与批判性思维的侵蚀

几十年来，成绩通胀一直是哈佛大学等机构关注的问题，其 A 等级占比从 2005 年的 24% 上升到 2025 年的 60% 以上。然而，Chirikov 认为 AI 引入了一个本质上不同的问题。以往的通胀驱动因素发生在评分阶段，而 AI 改变了“生产”阶段，在教师看到作业之前就改变了作品的创作方式。

这为更广泛的技术和专业领域带来了两大风险：

凭证贬值： 如果编程和写作密集型课程的成绩反映的是 AI 的输出而非人类的技能，雇主和研究生项目将难以做出准确的选拔决策。
技能萎缩： OpenAI 首席执行官 Sam Altman 曾警告称，如果没有系统性的教育变革，批判性思维技能面临“严重萎缩”的风险。如果学生将训练大脑的任务（如写作和编程）外包出去，他们毕业时可能缺乏掌握所用工具所需的底层逻辑。

核心要点

与非监督性工作的关联： 成绩通胀在家庭作业权重较高的课程中最为剧烈，这表明 AI 正被用于绕过学习，而非增强学习。
特定的脆弱领域： 由于 LLM 在这些领域的极高熟练度，写作和编程密集的课程面临着最高的“外包式”成绩通胀风险。
信号危机： 这种转变威胁到学术成绩与实际技能水平的挂钩，可能导致劳动力市场缺乏解决复杂问题所需的底层批判性思维能力。

AI驱动的成绩膨胀：为何高分可能意味着学习不足

AI 驱动的成绩通胀：为何高分可能意味着学习不足

成绩飙升背后的数据

家庭作业 vs. 监考考试：确凿的证据

学术信号功能与批判性思维的侵蚀

核心要点

继续阅读

人工智能与知识危机

当手写论文变成 99% 的 AI

苹果为何涨价：解析 AI 芯片价格飙升的原因

AI 技能萎缩陷阱

全球技能差距：为什么毕业生难以获得入门级工作