જનરેટિવ AI આકારો બનાવે છે, ગેમ્સ નહીં
મેં એક નવા Minecraft "prompt-to-build" ટૂલનું પરીક્ષણ કરવાનો પ્રયાસ કર્યો. મેં ક્રાંતિની અપેક્ષા રાખી હતી. તેના બદલે, મને માત્ર એક દીવાલનો નકશો મળ્યો.
આ ટૂલ એક મિનિટમાં ગોળો અથવા ટાવર બનાવી શકે છે. તે જોવામાં સારા લાગે છે. પરંતુ જે ક્ષણે મેં ચોક્કસ નિયમો માંગ્યા, તે નિષ્ફળ ગયું.
મેં દક્ષિણ તરફના દરવાજા સાથેના 15x15 લાકડાના કોટેજ (cottage) માટે પૂછ્યું. AI એ મને દરવાજા વગરની રાખોડી દીવાલ આપી. તેનું કદ ખોટું હતું. તેમાં લાકડું નહોતું. તે નકામું હતું.
અહીં મુખ્ય સમસ્યા છે:
જનરેટિવ મોડલ્સ એ તર્કસંગતતાના એન્જિન (plausibility engines) છે. ગેમ્સને ચોકસાઈના એન્જિન (correctness engines) ની જરૂર છે.
એક મોડલ એવી વસ્તુ બનાવી શકે છે જે "સાચી" દેખાય. પરંતુ ગેમ માટે એવી વસ્તુ જોઈએ છે જે ખરેખર "સાચી" હોય. મોડલને મોટું (scaling) કરવાથી આ સમસ્યા હલ થશે નહીં. તમે "ઘર જેવું દેખાવાથી" લઈને "કામ કરતા દરવાજાવાળા ઘર હોવા" સુધી માત્ર સ્કેલિંગ દ્વારા પહોંચી શકતા નથી.
આ અંતર ત્રણ ખૂટતી બાબતોને કારણે છે:
- ડિસ્ક્રીટ કન્સ્ટ્રેન્ટ્સ (Discrete constraints): એક મોડલ "નાનું" હોવાનો અંદાજ લગાવી શકે છે, પરંતુ તે "ચોક્કસ 15 બ્લોક્સ" ની ખાતરી આપી શકતું નથી.
- કમ્પોઝિશનલ સ્ટ્રક્ચર (Compositional structure): એક મોડલ આકાર દોરી શકે છે, પરંતુ તે એકબીજાના સંબંધમાં રહેલા અનેક પદાર્થોના દ્રશ્યનું સંચાલન કરી શકતું નથી.
- ફંક્શનલ કરेक्टનેસ (Functional correctness): એક મોડલ જાણતું નથી કે ખેલાડી ખરેખર દરવાજામાંથી પસાર થઈ શકે છે કે નહીં. તેને માત્ર એટલું જ ખબર છે કે દરવાજો કેવો દેખાય છે.
આને સુધારવા માટે, આપણે મોનોલિથિક (monolithic) મોડલ્સનો ઉપયોગ કરવાનું બંધ કરવું પડશે. આપણને એક એવા પાઇપલાઇનની જરૂર છે જે સતત (continuous) અને ડિસ્ક્રીટ (discrete) ને અલગ કરે:
- પ્લાન (Plan): પ્રોમ્પ્ટને નિયમોની કડક યાદી અને સીન ગ્રાફ (scene graph) માં બદલવા માટે સિમ્બોલિક પ્લાનરનો ઉપયોગ કરો.
- જનરેટ (Generate): દરેક પદાર્થ માટે વ્યક્તિગત આકારો બનાવવા માટે જનરેટિવ મોડલ્સનો ઉપયોગ કરો.
- પ્લેસ (Place): તે આકારોને એવી રીતે ગોઠવવા માટે સોલ્વરનો ઉપયોગ કરો જેથી તેઓ તમામ નિયમોનું પાલન કરે.
- વેરિફાય (Verify): પરિણામ મૂળ યોજના સાથે મેળ ખાય છે તે સાબિત કરવા માટે ચેકરનો ઉપયોગ કરો.
જનરેટર સુંદરતા પૂરી પાડે છે. સ્ટ્રક્ચર ચોકસાઈ પૂરી પાડે છે.
AI કન્ટેન્ટનું ભવિષ્ય કોઈ એક વિશાળ મોડલ નથી. તે સાથે મળીને કામ કરતા વિશિષ્ટ સાધનોની સિસ્ટમ છે. વિજેતા પાસે શ્રેષ્ઠ આકાર જનરેટર નહીં હોય. તેમની પાસે શ્રેષ્ઠ વેરિફિકેશન લૂપ (verification loop) હશે.
વૈકલ્પિક લર્નિંગ કમ્યુનિટી: https://t.me/GyaanSetuAi
