जनरेटिव AI आकृतियाँ बनाता है, गेम नहीं

मैंने एक नए Minecraft "prompt-to-build" टूल का परीक्षण करने की कोशिश की। मुझे एक क्रांति की उम्मीद थी। इसके बजाय, मुझे एक दीवार का नक्शा मिला।

यह टूल एक मिनट में एक गोला या मीनार बना सकता है। ये देखने में अच्छे लगते हैं। लेकिन जैसे ही मैंने विशिष्ट नियमों की मांग की, यह विफल हो गया।

मैंने दक्षिण की ओर खुलने वाले दरवाजे के साथ 15x15 के लकड़ी के कॉटेज की मांग की। AI ने मुझे बिना दरवाजे वाली एक ग्रे दीवार दे दी। इसका आकार गलत था। इसमें कोई लकड़ी नहीं थी। यह बेकार था।

यहाँ मुख्य समस्या है:

जनरेटिव मॉडल 'संभाव्यता इंजन' (plausibility engines) हैं। गेम को 'सटीकता इंजन' (correctness engines) की आवश्यकता होती है।

एक मॉडल ऐसी चीज़ बना सकता है जो "सही" दिखती हो। लेकिन एक गेम को ऐसी चीज़ चाहिए जो "सही" हो। मॉडल को बड़ा करने से यह समस्या हल नहीं होगी। आप "घर जैसा दिखने" से "काम करने वाले दरवाजे वाले घर होने" तक केवल स्केलिंग के माध्यम से नहीं पहुँच सकते।

यह अंतर तीन गायब हिस्सों के कारण है:

  • डिस्क्रीट बाधाएं (Discrete constraints): एक मॉडल "छोटा" होने का अनुमान लगा सकता है, लेकिन यह "ठीक 15 ब्लॉक" की गारंटी नहीं दे सकता।
  • संरचनात्मक ढांचा (Compositional structure): एक मॉडल एक आकृति बना सकता है, लेकिन वह एक-दूसरे के संबंध में कई वस्तुओं वाले दृश्य (scene) को प्रबंधित नहीं कर सकता।
  • कार्यात्मक सटीकता (Functional correctness): एक मॉडल को यह नहीं पता होता कि क्या कोई खिलाड़ी वास्तव में एक गेट से गुजर सकता है। उसे केवल यह पता होता है कि गेट कैसा दिखता है।

इसे ठीक करने के लिए, हमें मोनोलिथिक (monolithic) मॉडल का उपयोग करना बंद करना होगा। हमें एक ऐसे पाइपलाइन की आवश्यकता है जो निरंतर (continuous) को डिस्क्रीट (discrete) से अलग करे:

  1. योजना (Plan): प्रॉम्प्ट को नियमों की एक सख्त सूची और एक सीन ग्राफ (scene graph) में बदलने के लिए एक सिम्बोलिक प्लानर का उपयोग करें।
  2. निर्माण (Generate): प्रत्येक वस्तु के लिए व्यक्तिगत आकृतियाँ बनाने के लिए जनरेटिव मॉडल का उपयोग करें।
  3. स्थान निर्धारण (Place): उन आकृतियों को व्यवस्थित करने के लिए एक सॉल्वर (solver) का उपयोग करें ताकि वे सभी नियमों को पूरा करें।
  4. सत्यापन (Verify): यह साबित करने के लिए कि परिणाम मूल योजना से मेल खाता है, एक चेकर का उपयोग करें।

जनरेटर सुंदरता प्रदान करता है। संरचना सटीकता प्रदान करती है।

AI कंटेंट का भविष्य एक विशाल मॉडल नहीं है। यह एक साथ काम करने वाले विशेष उपकरणों (specialized tools) की एक प्रणाली है। विजेता के पास सबसे अच्छा शेप जनरेटर नहीं होगा। उनके पास सबसे अच्छा वेरिफिकेशन लूप (verification loop) होगा।

Source: https://dev.to/harrisonsec/generative-ai-builds-shapes-not-games-the-constraint-gap-and-the-architecture-that-closes-it-2e30

Optional learning community: https://t.me/GyaanSetuAi