生成AIが作るのは「形」であって、「ゲーム」ではない

新しいMinecraftの「prompt-to-build(プロンプトによる建築)」ツールを試してみた。革命的な体験を期待していたが、手元に残ったのはただの壁のマップだった。

そのツールは、球体や塔なら1分で作ることができる。見た目は良い。しかし、具体的なルールを指定した途端、失敗した。

「南向きのドアがある15x15の木造コテージ」を依頼したところ、AIが生成したのはドアのない灰色の壁だった。サイズは間違っており、木材も使われていない。使い物にならなかった。

問題の核心はここにある:

生成モデルは「もっともらしさ(plausibility)」のエンジンである。一方で、ゲームに必要なのは「正確さ(correctness)」のエンジンだ。

モデルは「正しそうに見える」ものを作ることができる。しかし、ゲームに必要なのは「正しい」ものである。モデルを大規模化しても、この問題は解決しない。「家のように見えるもの」から「機能するドアのある家」へと、スケールアップだけで到達することは不可能なのだ。

このギャップが生じる理由は、3つの欠けている要素があるからだ:

  • 離散的な制約(Discrete constraints):モデルは「小さい」を近似することはできるが、「正確に15ブロック」であることを保証することはできない。
  • 構成的な構造(Compositional structure):モデルは形を描くことはできるが、複数のオブジェクトが互いに関連し合うシーンを管理することはできない。
  • 機能的な正確さ(Functional correctness):モデルは、プレイヤーが実際にゲートを通り抜けられるかどうかを知らない。ただ、ゲートがどのような見た目であるかを知っているだけだ。

これを解決するには、モノリシック(単一的)なモデルの使用をやめなければならない。連続的なものと離散的なものを分離するパイプラインが必要だ:

  1. Plan(計画):シンボリックプランナーを使用して、プロンプトを厳格なルールリストとシーングラフに変換する。
  2. Generate(生成):生成モデルを使用して、各オブジェクトの個別の形状を作成する。
  3. Place(配置):ソルバーを使用して、それらの形状がすべてのルールを満たすように配置する。
  4. Verify(検証):チェッカーを使用して、結果が元の計画と一致していることを証明する。

生成器(Generator)は美しさを提供し、構造(Structure)は正確さを提供する。

AIコンテンツの未来は、一つの巨大なモデルにあるのではない。特化したツールが連携するシステムにある。勝者は、最高の形状生成器を持つ者ではない。最高の検証ループを持つ者なのだ。

Source: https://dev.to/harrisonsec/generative-ai-builds-shapes-not-games-the-constraint-gap-and-the-architecture-that-closes-it-2e30

Optional learning community: https://t.me/GyaanSetuAi