জেনারেটিভ এআই আকৃতি তৈরি করে, গেম নয়

আমি একটি নতুন Minecraft "prompt-to-build" টুল পরীক্ষা করার চেষ্টা করেছিলাম। আমি একটি বিপ্লবের আশা করেছিলাম। পরিবর্তে, আমি একটি দেয়ালের ম্যাপ পেলাম।

টুলটি এক মিনিটের মধ্যে একটি গোলক বা একটি টাওয়ার তৈরি করতে পারে। এগুলো দেখতে ভালো লাগে। কিন্তু যেই মুহূর্তে আমি নির্দিষ্ট কিছু নিয়মের কথা বললাম, এটি ব্যর্থ হলো।

আমি দক্ষিণমুখী দরজা সহ একটি ১৫x১৫ কাঠের কুঁড়েঘর চেয়েছিলাম। এআই আমাকে একটি দরজা বিহীন ধূসর দেয়াল দিল। এর আকার ভুল ছিল। এতে কোনো কাঠ ছিল না। এটি ছিল সম্পূর্ণ অকেজো।

মূল সমস্যাটি হলো:

জেনারেটিভ মডেলগুলো হলো বিশ্বাসযোগ্যতা তৈরির ইঞ্জিন (plausibility engines)। গেমের প্রয়োজন সঠিকতা নিশ্চিত করার ইঞ্জিন (correctness engines)।

একটি মডেল এমন কিছু তৈরি করতে পারে যা দেখতে "সঠিক" মনে হয়। কিন্তু একটি গেমের এমন কিছু প্রয়োজন যা প্রকৃতপক্ষে "সঠিক"। একটি মডেলকে আরও বড় করা বা স্কেল করা এই সমস্যার সমাধান করবে না। আপনি কেবল স্কেলিংয়ের মাধ্যমে "একটি বাড়ির মতো দেখতে হওয়া" থেকে "একটি কার্যকর দরজা সহ একটি বাড়ি হওয়া"র পর্যায়ে পৌঁছাতে পারবেন না।

এই ব্যবধানটি তিনটি অনুপস্থিত উপাদানের কারণে তৈরি হয়েছে:

  • ডিসক্রিট কনস্ট্রেইন্টস (Discrete constraints): একটি মডেল "ছোট" শব্দটিকে আনুমানিকভাবে প্রকাশ করতে পারে, কিন্তু এটি "ঠিক ১৫টি ব্লক" নিশ্চিত করতে পারে না।
  • কম্পোজিশনাল স্ট্রাকচার (Compositional structure): একটি মডেল একটি আকৃতি আঁকতে পারে, কিন্তু এটি একে অপরের সাপেক্ষে একাধিক বস্তুর একটি দৃশ্য পরিচালনা করতে পারে না।
  • ফাংশনাল কারেক্টনেস (Functional correctness): একজন খেলোয়াড় আসলে একটি গেটের মধ্য দিয়ে হাঁটতে পারবে কি না, তা মডেলটি জানে না। এটি কেবল জানে একটি গেট দেখতে কেমন।

এটি সমাধান করতে আমাদের মনোলিথিক (monolithic) মডেল ব্যবহার করা বন্ধ করতে হবে। আমাদের এমন একটি পাইপলাইন প্রয়োজন যা কন্টিনিউয়াস (continuous) এবং ডিসক্রিট (discrete) বিষয়গুলোকে আলাদা করে:

  1. পরিকল্পনা (Plan): একটি প্রম্পটকে নিয়মের একটি কঠোর তালিকা এবং একটি সিন গ্রাফে (scene graph) রূপান্তর করতে একটি সিম্বলিক প্ল্যানার ব্যবহার করুন।
  2. তৈরি করা (Generate): প্রতিটি বস্তুর জন্য আলাদা আলাদা আকৃতি তৈরি করতে জেনারেটিভ মডেল ব্যবহার করুন।
  3. স্থাপন করা (Place): সেই আকৃতিগুলোকে এমনভাবে সাজাতে একটি সলভার (solver) ব্যবহার করুন যাতে সেগুলো সমস্ত নিয়ম মেনে চলে।
  4. যাচাই করা (Verify): ফলাফলটি মূল পরিকল্পনার সাথে মিলেছে কি না তা প্রমাণ করতে একটি চেকার ব্যবহার করুন।

জেনারেটর সৌন্দর্য প্রদান করে। কাঠামো সঠিকতা প্রদান করে।

এআই কন্টেন্টের ভবিষ্যৎ একটি বিশাল মডেল নয়। এটি হলো একসাথে কাজ করা বিশেষায়িত টুলের একটি সিস্টেম। বিজয়ী তাদের কাছে সেরা শেপ জেনারেটর থাকবে না; বরং তাদের কাছে থাকবে সেরা ভেরিফিকেশন লুপ (verification loop)।

উৎস: https://dev.to/harrisonsec/generative-ai-builds-shapes-not-games-the-constraint-gap-and-the-architecture-that-closes-it-2e30

ঐচ্ছিক লার্নিং কমিউনিটি: https://t.me/GyaanSetuAi