Інфляція оцінок під впливом ШІ: чому вищі бали можуть свідчити про менше навчання

Translated for your language. Read the original.

AI-assisted draft.

In this article

Інфляція оцінок під впливом ШІ: чому вищі бали можуть свідчити про менше навчання

Швидка інтеграція генеративного ШІ в академічне середовище спричиняє значне зростання студентських оцінок, проте нові дослідження свідчать, що ця тенденція відображає передачу завдань на аутсорс, а не покращення когнітивних здібностей. Оскільки розподіл оцінок «A» зміщується вгору, освітяни та лідери галузі попереджають про загрозу «атрофії навичок», що може призвести до розриву між академічними дипломами та реальними компетенціями.

Дані, що стоять за стрибком оцінок

Всебічне дослідження дослідника Ігоря Чирикова, яке охоплювало 319 курсів у 84 кафедрах з 2018 по 2025 рік, виявляє приголомшливу тенденцію в академічній успішності. З моменту виходу ChatGPT у листопаді 2022 року частка оцінок «A» зросла на 13 відсоткових пунктів — приблизно на 30% вище базового рівня 2022 року. Цей зсув призвів до підвищення середнього бала (GPA) на 0,12 бала та значного звуження загального розподілу оцінок.

Дослідження підкреслює, що ця інфляція не є рівномірною для всіх дисциплін. Натомість вона найбільш виражена в курсах із високим рівнем «впливу ШІ» — зокрема в тих, де багато завдань із письма та програмування. Цікаво, що дані показують, що оцінки «A-» та «B+» часто «підтягуються» до чистих «A», що свідчить про систематичне зміщення оцінювання вгору.

Домашні завдання проти контрольованих іспитів: прямі докази

Найважливіший висновок дослідження полягає в тому, де саме відбуваються ці зростання оцінок. Якби ШІ справді покращував навчання, покращення оцінок було б помітним у всіх типах оцінювання. Однак дані демонструють чітку кореляцію між інфляцією оцінок та завданнями, що виконуються без нагляду.

У курсах, де домашні завдання становлять більше середнього відсоткового внеску у підсумкову оцінку, кількість оцінок «A» зросла ще на 16 відсоткових пунктів порівняно з курсами з меншим обсягом домашніх завдань при схожому рівні впливу ШІ. Навпаки, у курсах, що покладаються на іспити під наглядом або усні презентації — сфери, де корисність ШІ значно нижча — оцінки залишилися стабільними. Це свідчить про те, що сплеск оцінок є прямим результатом використання студентами ШІ для виконання завдань без нагляду, а не відображенням реальних педагогічних здобутків.

Ерозія академічного сигналування та критичного мислення

Протягом десятиліть інфляція оцінок була проблемою в таких закладах, як Гарвард, де частка оцінок «A» зросла з 24% у 2005 році до понад 60% до 2025 року. Однак Чириков стверджує, що ШІ створює принципово іншу проблему. Якщо попередні чинники інфляції виникали на етапі оцінювання, то ШІ змінює етап виробництва, змінюючи те, як робота створюється ще до того, як її побачить викладач.

Це створює два основні ризики для широкого технологічного та професійного середовища:

Знецінення дипломів: Якщо оцінки в курсах із великим обсягом програмування та письма відображають результати роботи ШІ, а не людські навички, роботодавцям та магістерським програмам буде важко приймати точні рішення при відборі.
Атрофія навичок: Генеральний директор OpenAI Сем Альтман попередив, що без системних освітніх змін навички критичного мислення ризикують зазнати «значної атрофії». Якщо студенти передаватимуть на аутсорс саме ті завдання, які тренують розум — такі як письмо та програмування, — вони можуть закінчити навчання, не маючи фундаментальної логіки, необхідної для опанування інструментів, якими вони користуються.

Основні висновки

Кореляція з роботою без нагляду: Інфляція оцінок є найбільш агресивною в курсах із високою вагою домашніх завдань, що свідчить про використання ШІ для обходу, а не доповнення навчання.
Специфічні вразливості: Навчальні програми з великим навантаженням у письмі та програмуванні перебувають під найбільшим ризиком «аутсорсингової» інфляції оцінок через високу майстерність LLM у цих сферах.
Криза сигналу: Цей зсув загрожує розривом між академічними оцінками та реальним рівнем навичок, що потенційно може створити робочу силу, якій бракуватиме фундаментального критичного мислення, необхідного для вирішення складних завдань.

Інфляція оцінок під впливом ШІ: чому вищі бали можуть свідчити про менше навчання

Інфляція оцінок під впливом ШІ: чому вищі бали можуть свідчити про менше навчання

Дані, що стоять за стрибком оцінок

Домашні завдання проти контрольованих іспитів: прямі докази

Ерозія академічного сигналування та критичного мислення

Основні висновки

Continue reading

ШІ та криза знань

𝗪𝗵𝗲𝗻 𝗮 𝗛𝗮𝗻𝗱𝘄𝗿𝗶𝘁𝘁𝗲𝗻 𝗧𝗵𝗲𝘀𝗶𝘀 𝗕𝗲𝗰𝗼𝗺𝗲𝘀 𝟵𝟵 𝗣𝗲𝗿𝗰𝗲𝗻𝘁 𝗔𝗜

Чому Apple підвищує ціни: пояснення стрибка вартості ШІ-чіпів

𝗧𝗵𝗲 𝗔𝗜 𝗦𝗸𝗶𝗹𝗹 𝗔𝘁𝗿𝗼𝗽𝗵𝘆 𝗧𝗿𝗮𝗽

Глобальний дефіцит навичок: чому випускникам важко отримати роботу початкового рівня