生成AIが作るのは「形」であって、「ゲーム」ではない
新しいMinecraftの「prompt-to-build(プロンプトによる建築)」ツールを試してみた。革命的な体験を期待していたが、手元に残ったのはただの壁のマップだった。
そのツールは、球体や塔なら1分で作ることができる。見た目は良い。しかし、具体的なルールを指定した途端、失敗した。
「南向きのドアがある15x15の木造コテージ」を依頼したところ、AIが生成したのはドアのない灰色の壁だった。サイズは間違っており、木材も使われていない。使い物にならなかった。
問題の核心はここにある:
生成モデルは「もっともらしさ(plausibility)」のエンジンである。一方で、ゲームに必要なのは「正確さ(correctness)」のエンジンだ。
モデルは「正しそうに見える」ものを作ることができる。しかし、ゲームに必要なのは「正しい」ものである。モデルを大規模化しても、この問題は解決しない。「家のように見えるもの」から「機能するドアのある家」へと、スケールアップだけで到達することは不可能なのだ。
このギャップが生じる理由は、3つの欠けている要素があるからだ:
- 離散的な制約(Discrete constraints):モデルは「小さい」を近似することはできるが、「正確に15ブロック」であることを保証することはできない。
- 構成的な構造(Compositional structure):モデルは形を描くことはできるが、複数のオブジェクトが互いに関連し合うシーンを管理することはできない。
- 機能的な正確さ(Functional correctness):モデルは、プレイヤーが実際にゲートを通り抜けられるかどうかを知らない。ただ、ゲートがどのような見た目であるかを知っているだけだ。
これを解決するには、モノリシック(単一的)なモデルの使用をやめなければならない。連続的なものと離散的なものを分離するパイプラインが必要だ:
- Plan(計画):シンボリックプランナーを使用して、プロンプトを厳格なルールリストとシーングラフに変換する。
- Generate(生成):生成モデルを使用して、各オブジェクトの個別の形状を作成する。
- Place(配置):ソルバーを使用して、それらの形状がすべてのルールを満たすように配置する。
- Verify(検証):チェッカーを使用して、結果が元の計画と一致していることを証明する。
生成器(Generator)は美しさを提供し、構造(Structure)は正確さを提供する。
AIコンテンツの未来は、一つの巨大なモデルにあるのではない。特化したツールが連携するシステムにある。勝者は、最高の形状生成器を持つ者ではない。最高の検証ループを持つ者なのだ。
Optional learning community: https://t.me/GyaanSetuAi
