Інфляція оцінок під впливом ШІ: чому вищі бали можуть свідчити про менше навчання
Швидка інтеграція генеративного ШІ в академічне середовище спричиняє значне зростання студентських оцінок, проте нові дослідження свідчать, що ця тенденція відображає передачу завдань на аутсорс, а не покращення когнітивних здібностей. Оскільки розподіл оцінок «A» зміщується вгору, освітяни та лідери галузі попереджають про загрозу «атрофії навичок», що може призвести до розриву між академічними дипломами та реальними компетенціями.
Дані, що стоять за стрибком оцінок
Всебічне дослідження дослідника Ігоря Чирикова, яке охоплювало 319 курсів у 84 кафедрах з 2018 по 2025 рік, виявляє приголомшливу тенденцію в академічній успішності. З моменту виходу ChatGPT у листопаді 2022 року частка оцінок «A» зросла на 13 відсоткових пунктів — приблизно на 30% вище базового рівня 2022 року. Цей зсув призвів до підвищення середнього бала (GPA) на 0,12 бала та значного звуження загального розподілу оцінок.
Дослідження підкреслює, що ця інфляція не є рівномірною для всіх дисциплін. Натомість вона найбільш виражена в курсах із високим рівнем «впливу ШІ» — зокрема в тих, де багато завдань із письма та програмування. Цікаво, що дані показують, що оцінки «A-» та «B+» часто «підтягуються» до чистих «A», що свідчить про систематичне зміщення оцінювання вгору.
Домашні завдання проти контрольованих іспитів: прямі докази
Найважливіший висновок дослідження полягає в тому, де саме відбуваються ці зростання оцінок. Якби ШІ справді покращував навчання, покращення оцінок було б помітним у всіх типах оцінювання. Однак дані демонструють чітку кореляцію між інфляцією оцінок та завданнями, що виконуються без нагляду.
У курсах, де домашні завдання становлять більше середнього відсоткового внеску у підсумкову оцінку, кількість оцінок «A» зросла ще на 16 відсоткових пунктів порівняно з курсами з меншим обсягом домашніх завдань при схожому рівні впливу ШІ. Навпаки, у курсах, що покладаються на іспити під наглядом або усні презентації — сфери, де корисність ШІ значно нижча — оцінки залишилися стабільними. Це свідчить про те, що сплеск оцінок є прямим результатом використання студентами ШІ для виконання завдань без нагляду, а не відображенням реальних педагогічних здобутків.
Ерозія академічного сигналування та критичного мислення
Протягом десятиліть інфляція оцінок була проблемою в таких закладах, як Гарвард, де частка оцінок «A» зросла з 24% у 2005 році до понад 60% до 2025 року. Однак Чириков стверджує, що ШІ створює принципово іншу проблему. Якщо попередні чинники інфляції виникали на етапі оцінювання, то ШІ змінює етап виробництва, змінюючи те, як робота створюється ще до того, як її побачить викладач.
Це створює два основні ризики для широкого технологічного та професійного середовища:
- Знецінення дипломів: Якщо оцінки в курсах із великим обсягом програмування та письма відображають результати роботи ШІ, а не людські навички, роботодавцям та магістерським програмам буде важко приймати точні рішення при відборі.
- Атрофія навичок: Генеральний директор OpenAI Сем Альтман попередив, що без системних освітніх змін навички критичного мислення ризикують зазнати «значної атрофії». Якщо студенти передаватимуть на аутсорс саме ті завдання, які тренують розум — такі як письмо та програмування, — вони можуть закінчити навчання, не маючи фундаментальної логіки, необхідної для опанування інструментів, якими вони користуються.
Основні висновки
- Кореляція з роботою без нагляду: Інфляція оцінок є найбільш агресивною в курсах із високою вагою домашніх завдань, що свідчить про використання ШІ для обходу, а не доповнення навчання.
- Специфічні вразливості: Навчальні програми з великим навантаженням у письмі та програмуванні перебувають під найбільшим ризиком «аутсорсингової» інфляції оцінок через високу майстерність LLM у цих сферах.
- Криза сигналу: Цей зсув загрожує розривом між академічними оцінками та реальним рівнем навичок, що потенційно може створити робочу силу, якій бракуватиме фундаментального критичного мислення, необхідного для вирішення складних завдань.