Генеративний ШІ створює форми, а не ігри
Я спробував протестувати новий інструмент Minecraft «prompt-to-build». Я очікував революції. Замість цього я отримав карту стіни.
Інструмент може створити сферу або вежу за хвилину. Вони виглядають непогано. Але щойно я попросив дотримуватися конкретних правил, він зазнав невдачі.
Я попросив дерев'яний котедж розміром 15x15 із дверима, що виходять на південь. ШІ видав мені сіру стіну без дверей. Розмір був неправильним. Дерева не було. Це було марно.
Ось у чому полягає основна проблема:
Генеративні моделі — це рушії правдоподібності. Іграм потрібні рушії правильності.
Модель може створити щось, що виглядає «правильно». Але грі потрібно щось, що «є» правильним. Масштабування моделі не вирішить цю проблему. Ви не зможете шляхом масштабування перейти від «схожості на будинок» до «будинку з робочими дверима».
Цей розрив існує через три відсутні елементи:
- Дискретні обмеження: модель може наблизити поняття «маленький», але вона не може гарантувати «рівно 15 блоків».
- Композиційна структура: модель може намалювати форму, але вона не здатна керувати сценою з багатьох об'єктів у їхньому взаємозв'язку.
- Функціональна правильність: модель не знає, чи зможе гравець насправді пройти крізь ворота. Вона знає лише те, як виглядають ворота.
Щоб виправити це, ми повинні припинити використовувати монолітні моделі. Нам потрібен пайплайн, який відокремлює безперервне від дискретного:
- Plan: Використовуйте символьний планувальник, щоб перетворити запит на суворий список правил і граф сцени (scene graph).
- Generate: Використовуйте генеративні моделі для створення окремих форм для кожного об'єкта.
- Place: Використовуйте солвер, щоб розташувати ці форми так, щоб вони відповідали всім правилам.
- Verify: Використовуйте перевіряючий інструмент (checker), щоб довести, що результат відповідає початковому плану.
Генератор забезпечує красу. Структура забезпечує правильність.
Майбутнє ШІ-контенту — це не одна гігантська модель. Це система спеціалізованих інструментів, що працюють разом. Переможець матиме не найкращий генератор форм, а найкращий цикл перевірки (verification loop).
Optional learning community: https://t.me/GyaanSetuAi
