تورم نمرات مبتنی بر هوش مصنوعی: چرا نمرات بالاتر ممکن است نشان‌دهنده یادگیری کمتر باشد

ادغام سریع هوش مصنوعی مولد در محیط‌های دانشگاهی باعث افزایش چشمگیر نمرات دانشجویان شده است، اما تحقیقات جدید نشان می‌دهد که این روند بیش از آنکه نشان‌دهنده بهبود توانایی‌های شناختی باشد، بازتاب‌دهنده برون‌سپاری کار است. با تغییر توزیع نمرات A به سمت بالا، مربیان و رهبران صنعت نسبت به یک «تحلیل رفتن مهارت‌ها» (skill atrophy) قریب‌الوقوع هشدار می‌دهند که می‌تواند مدارک تحصیلی را از شایستگی واقعی جدا کند.

داده‌های پشت پرده‌ی جهش نمرات

یک مطالعه جامع توسط پژوهشگر ایگور چیریکوف (Igor Chirikov) که ۳۱۹ درس را در ۸۴ دپارتمان از سال ۲۰۱۸ تا ۲۰۲۵ ردیابی کرده است، روند تکان‌دهنده‌ای را در عملکرد تحصیلی نشان می‌دهد. از زمان عرضه ChatGPT در نوامبر ۲۰۲۲، سهم نمرات A با ۱۳ واحد درصد افزایش یافته است که تقریباً ۳۰٪ بالاتر از سطح پایه در سال ۲۰۲۲ است. این تغییر باعث شده است که میانگین GPA به میزان ۰.۱۲ واحد افزایش یابد و توزیع کلی نمرات به طور قابل توجهی محدودتر شود.

این مطالعه تأکید می‌کند که این تورم در تمام رشته‌ها یکسان نیست. در عوض، این پدیده در درس‌هایی با «قرارگیری در معرض هوش مصنوعی» بالا — به‌ویژه درس‌هایی که ترکیبی سنگین از تکالیف نوشتاری و کدنویسی هستند — بسیار مشهودتر است. جالب اینجاست که داده‌ها نشان می‌دهند نمرات A-minus و B-plus مکرراً به نمره A ارتقا می‌یابند که نشان‌دهنده یک روند صعودی سیستماتیک در ارزیابی است.

تکالیف در مقابل آزمون‌های نظارت‌شده: دلیل اصلی (The Smoking Gun)

حیاتی‌ترین یافته این تحقیق در محل وقوع این افزایش نمرات نهفته است. اگر هوش مصنوعی واقعاً در حال تقویت یادگیری بود، بهبود نمرات باید در تمام انواع ارزیابی‌ها قابل مشاهده می‌بود. با این حال، داده‌ها همبستگی واضحی بین تورم نمرات و تکالیف بدون نظارت نشان می‌دهند.

در درس‌هایی که تکالیف بیش از وزن میانگینِ نمره نهایی را شامل می‌شوند، نمرات A نسبت به درس‌هایی با تکالیف کمتر و قرارگیری مشابه در معرض هوش مصنوعی، ۱۶ واحد درصد دیگر افزایش یافته است. در مقابل، در درس‌هایی که بر آزمون‌های نظارت‌شده یا ارائه‌های شفاهی متکی هستند — حوزه‌هایی که کاربرد هوش مصنوعی در آن‌ها به مراتب کمتر است — نمرات ثابت مانده‌اند. این امر نشان می‌دهد که جهش نمرات نتیجه مستقیم استفاده دانشجویان از هوش مصنوعی برای انجام تکالیف بدون نظارت است، نه بازتابی از دستاوردهای آموزشی واقعی.

فرسایش سیگنال‌دهی آکادمیک و تفکر انتقادی

برای دهه‌ها، تورم نمرات یکی از نگرانی‌های مؤسساتی مانند هاروارد بوده است، جایی که نمرات A از ۲۴٪ در سال ۲۰۰۵ به بیش از ۶۰٪ تا سال ۲۰۲۵ رسیده است. با این حال، چیریکوف استدلال می‌کند که هوش مصنوعی مشکلی اساساً متفاوت ایجاد می‌کند. در حالی که محرک‌های قبلی تورم در مرحله نمره‌دهی رخ می‌دادند، هوش مصنوعی مرحله تولید را تغییر می‌دهد و نحوه خلق اثر را حتی پیش از آنکه مدرس آن را ببیند، دگرگون می‌کند.

این امر دو ریسک بزرگ برای چشم‌انداز گسترده‌تر فناوری و حرفه‌ای ایجاد می‌کند:

  1. بی‌ارزش شدن مدارک: اگر نمرات در درس‌های سنگینِ کدنویسی و نوشتاری، به جای مهارت انسانی، بازتاب‌دهنده خروجی هوش مصنوعی باشند، کارفرمایان و برنامه‌های تحصیلات تکمیلی برای اتخاذ تصمیمات دقیق در انتخاب نیرو با مشکل مواجه خواهند شد.
  2. تحلیل رفتن مهارت‌ها: سام آلتمن، مدیرعامل OpenAI، هشدار داده است که بدون تغییرات سیستماتیک آموزشی، مهارت‌های تفکر انتقادی با خطر «تحلیل رفتن قابل توجه» مواجه هستند. اگر دانشجویان دقیقاً همان تکالیفی را که ذهن را آموزش می‌دهند — مانند نوشتن و برنامه‌نویسی — برون‌سپاری کنند، ممکن است بدون داشتن منطق بنیادی لازم برای تسلط بر ابزارهایی که استفاده می‌کنند، فارغ‌التحصیل شوند.

نکات کلیدی

  • همبستگی با کارهای بدون نظارت: تورم نمرات در درس‌هایی که تکالیف وزن بالایی دارند، شدیدتر است؛ این امر نشان می‌دهد که از هوش مصنوعی برای دور زدن یادگیری استفاده می‌شود، نه برای تقویت آن.
  • آسیب‌پذیری‌های خاص: برنامه‌های درسی سنگین در حوزه نوشتار و کدنویسی، به دلیل مهارت بالای LLMها در این حوزه‌ها، در بالاترین سطح خطر تورم نمرات «برون‌سپاری شده» قرار دارند.
  • بحران سیگنال‌دهی: این تغییر تهدید می‌کند که نمرات تحصیلی را از سطوح واقعی مهارت جدا کند و پتانسیل ایجاد نیروی کاری را دارد که فاقد تفکر انتقادی بنیادی برای حل مسائل پیچیده است.