Generatywna AI buduje kształty, a nie gry
Próbowałem przetestować nowe narzędzie typu „prompt-to-build” w Minecrafcie. Spodziewałem się rewolucji. Zamiast tego otrzymałem mapę ściany.
Narzędzie potrafi stworzyć sferę lub wieżę w minutę. Wyglądają one dobrze. Jednak w momencie, gdy poprosiłem o konkretne zasady, zawiodło.
Poprosiłem o drewnianą chatkę o wymiarach 15x15 z drzwiami skierowanymi na południe. AI dało mi szarą ścianę bez drzwi. Miała zły rozmiar. Nie miała drewna. Była bezużyteczna.
Oto sedno problemu:
Modele generatywne to silniki wiarygodności (plausibility engines). Gry potrzebują silników poprawności (correctness engines).
Model może stworzyć coś, co wygląda „poprawnie”. Ale gra potrzebuje czegoś, co „jest” poprawne. Zwiększanie skali modelu tego nie naprawi. Nie da się przejść przez skalowanie od „wyglądania jak dom” do „bycia domem z działającymi drzwiami”.
Luka ta wynika z trzech brakujących elementów:
- Ograniczenia dyskretne: Model może przybliżyć pojęcie „mały”, ale nie może zagwarantować „dokładnie 15 bloków”.
- Struktura kompozycyjna: Model może narysować kształt, ale nie potrafi zarządzać sceną składającą się z wielu obiektów względem siebie.
- Poprawność funkcjonalna: Model nie wie, czy gracz może faktycznie przejść przez bramę. Wie tylko, jak brama wygląda.
Aby to naprawić, musimy przestać używać monolitycznych modeli. Potrzebujemy potoku (pipeline), który oddzieli to, co ciągłe, od tego, co dyskretne:
- Planowanie: Użyj planisty symbolicznego, aby przekształcić prompt w ścisłą listę reguł i graf sceny (scene graph).
- Generowanie: Użyj modeli generatywnych do stworzenia poszczególnych kształtów dla każdego obiektu.
- Rozmieszczanie: Użyj solvera, aby ułożyć te kształty tak, aby spełniały wszystkie reguły.
- Weryfikacja: Użyj sprawdzającego (checker), aby udowodnić, że wynik jest zgodny z pierwotnym planem.
Generator zapewnia piękno. Struktura zapewnia poprawność.
Przyszłość treści tworzonych przez AI to nie jeden gigantyczny model. To system wyspecjalizowanych narzędzi współpracujących ze sobą. Zwycięzca nie będzie miał najlepszego generatora kształtów. Będzie miał najlepszą pętlę weryfikacji.
Opcjonalna społeczność edukacyjna: https://t.me/GyaanSetuAi
