Сатья Наделла застерігає від «token-maxing» в епоху ШІ-агентів
Генеральний директор Microsoft Сатья Наделла виступив із провокаційним застереженням проти «token-maxing» — тенденції використовувати дорогі передові моделі для завдань, які не виправдовують їхніх обчислювальних витрат. Визнаючи «залежність» від потужного ШІ, Наделла стверджує, що економічна цінність має базуватися на ефективності, а не на простому масштабуванні моделей.
Економічна пастка «token-maxing»
У нещодавньому інтерв'ю Наделла підкреслив критичний дисбаланс у сучасному ландшафті впровадження ШІ. Він ввів термін «token-maxing», щоб описати некритичне розгортання найсучасніших, ресурсомістких великих мовних моделей (LLM) для кожного можливого завдання. Для На델ли проблема полягає передусім в юніт-економіці: «Жорстока правда полягає в тому, що граничні витрати на підвищення продуктивності мають відповідати граничним витратам на токен».
Якщо компанія використовує масивну, дорогу передову модель для вирішення тривіальної проблеми, з якою могла б впоратися менша спеціалізована модель, вартість «токена» перевищує прирост продуктивності. Наделла припускає, що для того, щоб ШІ стимулював справжнє, стале економічне зростання, галузь має перейти до більш тонкої оркестрації моделей, де складність інструменту відповідає складності проблеми.
Перехід від кодування до когнітивного охоплення
Попри його застереження щодо ефективності, бачення На델ла щодо майбутнього програмної інженерії є надзвичайно ресурсомістким. Він прогнозує зміну парадигми, коли розробники відійдуть від ручного написання синтаксису на користь управління величезними роями ШІ-агентів. У такому майбутньому один інженер може контролювати сотні або навіть тисячі автономних агентів, що генерують код у режимі реального часу.
Щоб орієнтуватися в цьому, Наделла вводить поняття «когнітивного охоплення» (cognitive coverage). Оскільки розробники переходять від ролі авторів до ролі супервайзерів, їхньою основною навичкою стане здатність глибоко розуміти та проводити аудит коду, який вони не писали особисто. «У мене є репозиторій, повний коду, написаного агентами. Я когнітивно розумію, що сталося», — зазначив Наделла, підкресливши, що хоча ручна праця з кодування зменшується, потреба в глибокій освіті в галузі комп'ютерних наук залишається вищою, ніж будь-коли, для забезпечення цілісності системи.
Чому це важливо для екосистеми ШІ
Коментарі Наделлы свідчать про зрілість індустрії ШІ. Ми переходимо від фази «вау-ефекту» передових моделей до ери оптимізації та агентських робочих процесів. Для розробників і засновників висновок очевидний: майбутня цінність полягає не лише в отриманні доступу до найбільших моделей, а й у створенні складних рівнів оркестрації, які можуть розгортати правильну модель у правильний час. Переможцями у цій сфері стануть ті, хто опанує «когнітивне охоплення», зберігаючи при цьому фінансову дисципліну, щоб уникнути пастки «максимізації токенів».
Ключові висновки
- Ефективність має першочергове значення: Справжнє економічне зростання в галузі ШІ потребує відповідності граничної вартості токенів моделі фактичному приросту продуктивності, який вони забезпечують.
- Зростання когнітивного охоплення: Програмна інженерія переходить від ручного написання коду до високорівневого нагляду та аудиту масивних баз коду, створених агентами.
- Агентська оркестрація: Наступний рубіж розробки передбачає управління тисячами ШІ-агентів, що потребує глибоких фундаментальних знань у галузі комп'ютерних наук для збереження контролю.