تورم نمرات مبتنی بر هوش مصنوعی: چرا نمرات بالاتر ممکن است نشاندهنده یادگیری کمتر باشد
ادغام سریع هوش مصنوعی مولد در محیطهای دانشگاهی باعث افزایش چشمگیر نمرات دانشجویان شده است، اما تحقیقات جدید نشان میدهد که این روند بیش از آنکه نشاندهنده بهبود تواناییهای شناختی باشد، بازتابدهنده برونسپاری کار است. با تغییر توزیع نمرات A به سمت بالا، مربیان و رهبران صنعت نسبت به یک «تحلیل رفتن مهارتها» (skill atrophy) قریبالوقوع هشدار میدهند که میتواند مدارک تحصیلی را از شایستگی واقعی جدا کند.
دادههای پشت پردهی جهش نمرات
یک مطالعه جامع توسط پژوهشگر ایگور چیریکوف (Igor Chirikov) که ۳۱۹ درس را در ۸۴ دپارتمان از سال ۲۰۱۸ تا ۲۰۲۵ ردیابی کرده است، روند تکاندهندهای را در عملکرد تحصیلی نشان میدهد. از زمان عرضه ChatGPT در نوامبر ۲۰۲۲، سهم نمرات A با ۱۳ واحد درصد افزایش یافته است که تقریباً ۳۰٪ بالاتر از سطح پایه در سال ۲۰۲۲ است. این تغییر باعث شده است که میانگین GPA به میزان ۰.۱۲ واحد افزایش یابد و توزیع کلی نمرات به طور قابل توجهی محدودتر شود.
این مطالعه تأکید میکند که این تورم در تمام رشتهها یکسان نیست. در عوض، این پدیده در درسهایی با «قرارگیری در معرض هوش مصنوعی» بالا — بهویژه درسهایی که ترکیبی سنگین از تکالیف نوشتاری و کدنویسی هستند — بسیار مشهودتر است. جالب اینجاست که دادهها نشان میدهند نمرات A-minus و B-plus مکرراً به نمره A ارتقا مییابند که نشاندهنده یک روند صعودی سیستماتیک در ارزیابی است.
تکالیف در مقابل آزمونهای نظارتشده: دلیل اصلی (The Smoking Gun)
حیاتیترین یافته این تحقیق در محل وقوع این افزایش نمرات نهفته است. اگر هوش مصنوعی واقعاً در حال تقویت یادگیری بود، بهبود نمرات باید در تمام انواع ارزیابیها قابل مشاهده میبود. با این حال، دادهها همبستگی واضحی بین تورم نمرات و تکالیف بدون نظارت نشان میدهند.
در درسهایی که تکالیف بیش از وزن میانگینِ نمره نهایی را شامل میشوند، نمرات A نسبت به درسهایی با تکالیف کمتر و قرارگیری مشابه در معرض هوش مصنوعی، ۱۶ واحد درصد دیگر افزایش یافته است. در مقابل، در درسهایی که بر آزمونهای نظارتشده یا ارائههای شفاهی متکی هستند — حوزههایی که کاربرد هوش مصنوعی در آنها به مراتب کمتر است — نمرات ثابت ماندهاند. این امر نشان میدهد که جهش نمرات نتیجه مستقیم استفاده دانشجویان از هوش مصنوعی برای انجام تکالیف بدون نظارت است، نه بازتابی از دستاوردهای آموزشی واقعی.
فرسایش سیگنالدهی آکادمیک و تفکر انتقادی
برای دههها، تورم نمرات یکی از نگرانیهای مؤسساتی مانند هاروارد بوده است، جایی که نمرات A از ۲۴٪ در سال ۲۰۰۵ به بیش از ۶۰٪ تا سال ۲۰۲۵ رسیده است. با این حال، چیریکوف استدلال میکند که هوش مصنوعی مشکلی اساساً متفاوت ایجاد میکند. در حالی که محرکهای قبلی تورم در مرحله نمرهدهی رخ میدادند، هوش مصنوعی مرحله تولید را تغییر میدهد و نحوه خلق اثر را حتی پیش از آنکه مدرس آن را ببیند، دگرگون میکند.
این امر دو ریسک بزرگ برای چشمانداز گستردهتر فناوری و حرفهای ایجاد میکند:
- بیارزش شدن مدارک: اگر نمرات در درسهای سنگینِ کدنویسی و نوشتاری، به جای مهارت انسانی، بازتابدهنده خروجی هوش مصنوعی باشند، کارفرمایان و برنامههای تحصیلات تکمیلی برای اتخاذ تصمیمات دقیق در انتخاب نیرو با مشکل مواجه خواهند شد.
- تحلیل رفتن مهارتها: سام آلتمن، مدیرعامل OpenAI، هشدار داده است که بدون تغییرات سیستماتیک آموزشی، مهارتهای تفکر انتقادی با خطر «تحلیل رفتن قابل توجه» مواجه هستند. اگر دانشجویان دقیقاً همان تکالیفی را که ذهن را آموزش میدهند — مانند نوشتن و برنامهنویسی — برونسپاری کنند، ممکن است بدون داشتن منطق بنیادی لازم برای تسلط بر ابزارهایی که استفاده میکنند، فارغالتحصیل شوند.
نکات کلیدی
- همبستگی با کارهای بدون نظارت: تورم نمرات در درسهایی که تکالیف وزن بالایی دارند، شدیدتر است؛ این امر نشان میدهد که از هوش مصنوعی برای دور زدن یادگیری استفاده میشود، نه برای تقویت آن.
- آسیبپذیریهای خاص: برنامههای درسی سنگین در حوزه نوشتار و کدنویسی، به دلیل مهارت بالای LLMها در این حوزهها، در بالاترین سطح خطر تورم نمرات «برونسپاری شده» قرار دارند.
- بحران سیگنالدهی: این تغییر تهدید میکند که نمرات تحصیلی را از سطوح واقعی مهارت جدا کند و پتانسیل ایجاد نیروی کاری را دارد که فاقد تفکر انتقادی بنیادی برای حل مسائل پیچیده است.