Генеративный ИИ создает формы, а не игры
Я попытался протестировать новый инструмент для Minecraft с функцией «prompt-to-build». Я ожидал революции. Вместо этого я получил карту стены.
Инструмент может создать сферу или башню за минуту. Они выглядят неплохо. Но как только я запросил соблюдение конкретных правил, он потерпел неудачу.
Я попросил деревянный коттедж размером 15x15 с дверью, обращенной на юг. ИИ выдал мне серую стену без двери. Размер был неверным. Дерева не было. Это было бесполезно.
Вот в чем заключается основная проблема:
Генеративные модели — это движки правдоподобия. Играм же нужны движки корректности.
Модель может создать что-то, что выглядит «правильно». Но игре нужно то, что «является» правильным. Увеличение масштаба модели ничего не решит. Нельзя просто масштабировать переход от «похоже на дом» к «является домом с работающей дверью».
Этот разрыв существует из-за трех недостающих элементов:
- Дискретные ограничения: модель может аппроксимировать понятие «маленький», но она не может гарантировать «ровно 15 блоков».
- Композиционная структура: модель может нарисовать форму, но она не может управлять сценой из множества объектов, взаимодействующих друг с другом.
- Функциональная корректность: модель не знает, сможет ли игрок на самом деле пройти через ворота. Она знает только то, как выглядят ворота.
Чтобы исправить это, мы должны перестать использовать монолитные модели. Нам нужен конвейер (pipeline), который отделяет непрерывное от дискретного:
- Планирование: используйте символьный планировщик, чтобы превратить запрос в строгий список правил и граф сцены (scene graph).
- Генерация: используйте генеративные модели для создания отдельных форм для каждого объекта.
- Размещение: используйте решатель (solver), чтобы расположить эти формы так, чтобы они соответствовали всем правилам.
- Проверка: используйте верификатор (checker), чтобы доказать, что результат соответствует исходному плану.
Генератор обеспечивает красоту. Структура обеспечивает корректность.
Будущее ИИ-контента — это не одна гигантская модель. Это система специализированных инструментов, работающих сообща. Победителем станет не тот, у кого лучший генератор форм, а тот, у кого лучший цикл верификации.
Дополнительное обучающее сообщество: https://t.me/GyaanSetuAi
