യഥാർത്ഥ ലോകത്തിലെ AI നിർമ്മിക്കാൻ General Intuition എങ്ങനെയാണ് വീഡിയോ ഗെയിമുകളെ ഉപയോഗിക്കുന്നത്

ഭൗതിക ലോകത്തിനായി ഏജന്റിക് മോഡലുകളെ (agentic models) പരിശീലിപ്പിക്കുന്നതിനായി വൻതോതിലുള്ള വീഡിയോ ഗെയിം ഡാറ്റാസെറ്റുകൾ ഉപയോഗിച്ചുകൊണ്ട് റോബോട്ടിക്സിൽ വലിയൊരു മാറ്റം കൊണ്ടുവരാനാണ് General Intuition ശ്രമിക്കുന്നത്. പുതിയതായി ലഭിച്ച 320 മില്യൺ ഡോളറിന്റെ ഫണ്ടിംഗിലൂടെ, ഗെയിമിംഗിൽ കാണപ്പെടുന്ന "ആക്ഷൻ ഡാറ്റ" (action data) കൃത്രിമബുദ്ധിക്ക് (AI) ആവശ്യമായ പ്രധാന കണ്ണിയാണെന്ന് ഈ സ്റ്റാർട്ടപ്പ് വിശ്വസിക്കുന്നു.

ആക്ഷൻ ലേബലുകളുടെയും സ്പേഷ്യൽ-ടെമ്പറൽ റീസണിംഗിന്റെയും (Spatial-Temporal Reasoning) കരുത്ത്

പല AI ഗവേഷകരും വീഡിയോ ദൃശ്യങ്ങൾ നിരീക്ഷിച്ചുകൊണ്ട് മാത്രം മോഡലുകളെ പരിശീലിപ്പിക്കാൻ ശ്രമിക്കുമ്പോൾ, വീഡിയോ മാത്രം മതിയാകില്ലെന്ന് General Intuition CEO പിം ഡി വിറ്റെ (Pim de Witte) വാദിക്കുന്നു. ഉപയോക്താക്കൾ വീഡിയോ ഗെയിം ക്ലിപ്പുകൾ പങ്കുവെക്കുന്ന Medal എന്ന പ്ലാറ്റ്‌ഫോമിൽ നിന്നുള്ള പ്രത്യേക ഡാറ്റ ലഭ്യമാണ് എന്നതാണ് ഈ കമ്പനിയുടെ പ്രധാന നേട്ടം.

സാധാരണ വീഡിയോകളിൽ നിന്ന് വ്യത്യസ്തമായി, ഈ ക്ലിപ്പുകളിൽ "ആക്ഷൻ ലേബലുകൾ" (action labels) ഉൾപ്പെടുത്തിയിട്ടുണ്ട്—അതായത് ഒരു കളിക്കാരൻ ഏത് ബട്ടണുകളാണ് എപ്പോൾ അമർത്തിയത് എന്നതിന്റെ കൃത്യമായ വിവരങ്ങൾ. ഇത് കേവലം പാറ്റേൺ തിരിച്ചറിയുന്നതിനും അപ്പുറം സ്പേഷ്യൽ-ടെമ്പറൽ റീസണിംഗ് (spatial-temporal reasoning) പഠിക്കാൻ മോഡലിനെ സഹായിക്കുന്നു. ഒരു പ്രത്യേക ഇൻപുട്ടും (ഒരു ആക്ഷൻ) അതിന്റെ ഫലമായി ചുറ്റുപാടുകളിൽ ഉണ്ടാകുന്ന മാറ്റവും (പ്രതികരണം) തമ്മിലുള്ള നേരിട്ടുള്ള ബന്ധം മനസ്സിലാക്കുന്നതിലൂടെ, AI കാരണവും ഫലവും (causality) തിരിച്ചറിയാൻ തുടങ്ങുന്നു. ഇത് ഒരു സ്വയംഭരണ ഏജന്റിന് (autonomous agent) ആവശ്യമായ അടിസ്ഥാനപരമായ കാര്യമായ "സ്വയം" (self) എന്നതിനെ "ചുറ്റുപാടുകളിൽ" (environment) നിന്ന് വേർതിരിച്ചറിയാൻ മോഡലിനെ പ്രാപ്തമാക്കുന്നു.

ഫോർട്ട്‌നൈറ്റിൽ (Fortnite) നിന്ന് ക്വാഡ്രുപെഡ് റോബോട്ടുകളിലേക്ക് (Quadruped Robots)

ഗെയിംപ്ലേ, സിമുലേഷൻ, ഭൗതിക രൂപം (physical embodiment) എന്നിങ്ങനെ വിവിധ മേഖലകളിൽ പ്രവർത്തിക്കാൻ കഴിയുന്ന ഒരു ഏകീകൃത മോഡൽ നിർമ്മിക്കുക എന്നതാണ് കമ്പനിയുടെ സാങ്കേതിക ലക്ഷ്യം. സമീപകാല പ്രകടനങ്ങളിൽ, ഗെയിംപ്ലേ ഉപയോഗിച്ച് പരിശീലിപ്പിച്ച ഒരു AI ഏജന്റിന് സങ്കീർണ്ണമായ വെർച്വൽ പരിതസ്ഥിതികളിലൂടെ സഞ്ചരിക്കാനും, ഭിത്തികൾ കഠിനമായ വസ്തുക്കളാണെന്നും സൂര്യന്റെ ചലനത്തിനനുസരിച്ച് നിഴലുകൾ മാറുന്നുണ്ടെന്നും മനസ്സിലാക്കാനും സാധിച്ചു.

ഏറ്റവും പ്രധാനമായി, ഈ "തലച്ചോറ്" നേരിട്ട് ഹാർഡ്‌വെയറിലേക്ക് മാറ്റുകയാണ് ചെയ്യുന്നത്. ഗെയിമിംഗ് ഏജന്റുകൾക്ക് ഉപയോഗിക്കുന്ന അതേ മോഡൽ ഉപയോഗിച്ച് പ്രവർത്തിക്കുന്ന ഒരു ക്വാഡ്രുപെഡൽ റോബോട്ടിനെ (quadrupedal robot) കമ്പനി പ്രദർശിപ്പിച്ചു. റോബോട്ടിന്റെ നാവിഗേഷനായി മോഡലിനെ ഫൈൻ ട്യൂൺ ചെയ്യാൻ യഥാർത്ഥ തെരുവുകളിൽ നിന്ന് ശേഖരിച്ച വെറും എട്ട് മിനിറ്റ് ദൈർഘ്യമുള്ള റോബോട്ടിക്സ് ഡാറ്റ മാത്രം മതിയായിരുന്നു എന്ന് ടീം അറിയിച്ചു. ഭൗതികശാസ്ത്രവും (physics) സ്ഥലകാല അവബോധവും (spatial awareness) പഠിക്കുന്നതിനുള്ള കഠിനമായ ജോലി വീഡിയോ ഗെയിമുകളുടെ "ജിമ്മിൽ" വെച്ച് നടക്കുന്നുവെന്നും, ഇത് യഥാർത്ഥ ലോകത്ത് റോബോട്ടുകളെ ഉപയോഗിക്കുന്നത് കൂടുതൽ കാര്യക്ഷമമാക്കുന്നുവെന്നും ഇതിലൂടെ വ്യക്തമാകുന്നു.

ജനറൽ ഏജന്റുകളിൽ ഒരു 2.3 ബില്യൺ ഡോളറിന്റെ പന്തയം

കമ്പനിയുടെ മൂല്യനിർണ്ണയത്തിൽ ഈ ലക്ഷ്യത്തിന്റെ വ്യാപ്തി പ്രതിഫലിക്കുന്നുണ്ട്. General Intuition അടുത്തിടെ 2.3 ബില്യൺ ഡോളർ മൂല്യത്തിൽ 320 മില്യൺ ഡോളർ സമാഹരിച്ചു, ഇതോടെ കമ്പനിയുടെ ആകെ ഫണ്ടിംഗ് 454 മില്യൺ ഡോളറിലെത്തി. Khosla Ventures ആണ് ഈ ഫണ്ടിംഗ് റണ്ടിന് നേതൃത്വം നൽകിയത്; കൂടാതെ General Catalyst, Jeff Bezos, Eric Schmidt, Google DeepMind, MIT എന്നിവയിലെ ഗവേഷകർ എന്നിവരും ഇതിൽ പങ്കാളികളായിട്ടുണ്ട്.

ഈ മൂലധനം രണ്ട് പ്രധാന ലക്ഷ്യങ്ങൾക്കായി മാറ്റിവെച്ചിരിക്കുന്നു: CoreWeave-മായുള്ള പങ്കാളിത്തത്തിലൂടെ കമ്പ്യൂട്ട് ശേഷി വർദ്ധിപ്പിക്കുക, വേനൽക്കാലാവസാനത്തോടെ അവരുടെ API കൂടുതൽ ആളുകളിലേക്ക് എത്തിക്കുക. വിനോദ് ഖോസ്‌ലയെപ്പോലുള്ള നിക്ഷേപകരെ സംബന്ധിച്ചിടത്തോളം, ലക്ഷ്യം മെച്ചപ്പെട്ട ഓട്ടോമേഷൻ മാത്രമല്ല, മറിച്ച് "AI ഇൻട്യൂഷൻ" (AI intuition) എന്ന മനുഷ്യസമാനമായ കഴിവിന്റെ ഉദയമാണ്—അതായത് വെറും പ്രോഗ്രാം ചെയ്ത നിർദ്ദേശങ്ങൾ പാലിക്കുന്നതിന് പകരം കാര്യങ്ങൾ മനസ്സിലാക്കി ലോകത്തെ ചലിച്ചറിയാനുള്ള കഴിവ്.

പ്രധാന കാര്യങ്ങൾ

  • ആക്ഷൻ അധിഷ്ഠിത പരിശീലനം: വീഡിയോ മാത്രം ഉപയോഗിച്ചുള്ള പരിശീലനത്തിന്റെ പരിമിതികൾ മറികടന്ന്, AI-ക്ക് കാരണവും ഫലവും (causality) പഠിപ്പിക്കുന്നതിനായി ഗെയിമിംഗ് ക്ലിപ്പുകളിൽ നിന്നുള്ള ബട്ടൺ പ്രസ്സ് "ആക്ഷൻ ലേബലുകൾ" General Intuition ഉപയോഗിക്കുന്നു.
  • സ്കെയിലബിൾ സിമുലേഷൻ: വീഡിയോ ഗെയിമുകളെ ഒരു "ജിം" ആയി ഉപയോഗിക്കുന്നതിലൂടെ, യഥാർത്ഥ ലോകത്തെ റോബോട്ടിക് ഡാറ്റ ശേഖരിക്കുന്നതിനുള്ള വലിയ ചിലവില്ലാതെ തന്നെ സങ്കീർണ്ണമായ സ്പേഷ്യൽ-ടെമ്പറൽ റീസണിംഗ് പരിശീലിപ്പിക്കാൻ കമ്പനിക്ക് സാധിക്കുന്നു.
  • വൻതോതിലുള്ള സ്ഥാപനപരമായ പിന്തുണ: 2.3 ബില്യൺ ഡോളർ മൂല്യവും Jeff Bezos, Eric Schmidt തുടങ്ങിയ പ്രമുഖരുടെ പിന്തുണയും ഉള്ളതോടെ, വേൾഡ് മോഡൽ (world model) യുഗത്തിലെ ഒരു അടിസ്ഥാന ഘടകമായി കമ്പനി മാറുകയാണ്.