L'IA générative construit des formes, pas des jeux
J'ai tenté de tester un nouvel outil de « prompt-to-build » pour Minecraft. Je m'attendais à une révolution. Au lieu de cela, j'ai obtenu le plan d'un mur.
L'outil peut créer une sphère ou une tour en une minute. Le rendu est satisfaisant. Mais dès que j'ai demandé des règles spécifiques, il a échoué.
J'ai demandé un chalet en bois de 15x15 avec une porte orientée vers le sud. L'IA m'a donné un mur gris sans porte. La taille n'était pas la bonne. Il n'y avait pas de bois. C'était inutile.
Voici le problème de fond :
Les modèles génératifs sont des moteurs de plausibilité. Les jeux ont besoin de moteurs de justesse.
Un modèle peut créer quelque chose qui a l'air « correct ». Mais un jeu a besoin de quelque chose qui « est » correct. Augmenter la taille d'un modèle ne résoudra pas ce problème. On ne peut pas passer par une simple mise à l'échelle pour passer de « ressembler à une maison » à « être une maison avec une porte fonctionnelle ».
Cet écart s'explique par trois éléments manquants :
- Contraintes discrètes : un modèle peut approximer le concept de « petit », mais il ne peut pas garantir « exactement 15 blocs ».
- Structure compositionnelle : un modèle peut dessiner une forme, mais il ne peut pas gérer une scène composée de plusieurs objets les uns par rapport aux autres.
- Justesse fonctionnelle : un modèle ne sait pas si un joueur peut réellement traverser un portail. Il sait seulement à quoi ressemble un portail.
Pour corriger cela, nous devons cesser d'utiliser des modèles monolithiques. Nous avons besoin d'un pipeline qui sépare le continu du discret :
- Planifier : utiliser un planificateur symbolique pour transformer un prompt en une liste stricte de règles et un graphe de scène.
- Générer : utiliser des modèles génératifs pour créer les formes individuelles de chaque objet.
- Placer : utiliser un solveur pour disposer ces formes de manière à ce qu'elles respectent toutes les règles.
- Vérifier : utiliser un vérificateur pour prouver que le résultat correspond au plan initial.
Le générateur apporte la beauté. La structure apporte la justesse.
L'avenir du contenu généré par l'IA ne réside pas dans un seul modèle géant. Il s'agit d'un système d'outils spécialisés travaillant ensemble. Le gagnant ne sera pas celui qui possède le meilleur générateur de formes, mais celui qui possédera la meilleure boucle de vérification.
Communauté d'apprentissage optionnelle : https://t.me/GyaanSetuAi
