Три ідеї, які зробили сучасний ШІ можливим

Translated for your language. Read the original.

AI-assisted draft.

Три ідеї, які зробили сучасний ШІ можливим

Сучасний ШІ здається магією. Ви вводите речення, а машина пише відповідь. Це здається чимось екзотичним. Але це не так.

Архітектура майже кожної моделі ґрунтується на звичайних інженерних рішеннях. Ці рішення вирішили конкретні проблеми. Тут немає ніякої «секретної інгредієнта». Є лише три ключові виправлення.

Skip Connections

Близько 2014 року інженери намагалися зробити нейронні мережі глибшими. Вони вважали, що більше шарів означає кращі результати. Вони помилялися. Глибші мережі часто працювали гірше, тому що сигнал помилки не міг дістатися до початкових шарів. Сигнал або зникав до нуля, або вибухав.

Skip connections вирішили цю проблему. Замість того, щоб змушувати кожен шар змінювати вхідні дані, ви дозволяєте входу «перестрибувати» вперед. Ви додаєте початковий вхід назад до виходу.

Це робить дві речі:

Це полегшує принцип «нічого не робити». Якщо шар не додає цінності, вхідні дані проходять крізь нього без змін.
Це створює прямий шлях для сигналу помилки. Сигнал отримує «експрес-лінію» до початкових шарів.

Normalization

Коли дані проходять крізь мережу, масштаб чисел змінюється. Один шар може видати 0,01, тоді як наступний — 5000. Коли числа досягають таких екстремальних значень, навчання зупиняється.

Normalization вирівнює масштаб. Вона повторно центрує числа навколо нуля та підтримує їх у стабільному діапазоні. Це дозволяє використовувати вищу швидкість навчання і тренуватися набагато швидше. Це дозволяє математичним обчисленням працювати коректно.

Attention

Старі моделі читали текст по одному слову за раз. Це було повільно і призводило до «забування». Щоб пов'язати перше слово з останнім, інформація мала пройти крізь кожне слово між ними. До кінця початок втрачався.

Attention змінює це. Замість того, щоб читати послідовно, кожне слово одночасно «дивиться» на всі інші слова в реченні. Слово "it" може дивитися безпосередньо на свій іменник, незалежно від того, як далеко він знаходиться.

Оскільки ніщо не залежить від конкретного порядку, ви можете обробляти все одночасно. Це робить навчання швидким і ефективним.

Transformer — це результат поєднання цих трьох ідей. Він використовує блоки attention, обгорнуті в skip connections, з нормалізацією між ними.

ШІ — це не чаклунство. Це результат того, що люди помітили поломку і виправили її за допомогою простої математики.

Source: https://dev.to/karthi_raman_02ec8161bda/three-ideas-made-modern-ai-possible-none-of-them-are-magic-ida

Optional learning community: https://t.me/GyaanSetuAi

Три ідеї, які зробили сучасний ШІ можливим

Continue reading

Виправлення галюцинацій ШІ

ШІ не замінює мислення. Він його підсилює.

𝗧𝗵𝗲 𝗠𝗮𝗴𝗶𝗰 𝗕𝘂𝗯𝗯𝗹𝗲 𝗔𝗿𝗼𝘂𝗻𝗱 𝗔𝗜 𝗛𝗮𝘀 𝗕𝘂𝗿𝘀𝘁

𝗧𝗵𝗿𝗲𝗲 𝗜𝗱𝗲𝗮𝘀 𝗧𝗵𝗮𝘁 𝗠𝗮𝗱𝗲 𝗔𝗜 𝗣𝗼𝘀𝘀𝗶𝗯𝗹𝗲

𝗦𝘁𝗼𝗽 𝗧𝗲𝗹𝗹𝗶𝗻𝗴 𝗬𝗼𝘂𝗿 𝗔𝗜 𝘁𝗼 𝗯𝗲 𝗰𝗮𝗿𝗲𝗳𝘂𝗹