ഫിസിക്കൽ AI-യിലെ നിർണ്ണായകമായ ഡാറ്റാ തടസ്സം പരിഹരിക്കാൻ XDOF രംഗത്ത് എത്തുന്നു
OpenAI അതിന്റെ റോബോട്ടിക്സ് പ്രോഗ്രാം പുനരാരംഭിച്ചതോടെ ഫിസിക്കൽ ഇന്റലിജൻസിനായുള്ള മത്സരം മുറുകുകയാണ്. ഇതിനോടൊപ്പം തന്നെ ഒരു പുതിയ വെല്ലുവിളിയും ഉയർന്നുവന്നിരിക്കുന്നു: ഉയർന്ന നിലവാരമുള്ള (high-fidelity) പരിശീലന ഡാറ്റയുടെ അഭാവം. ലാർജ് ലാംഗ്വേജ് മോഡലുകൾ (LLMs) പൊതു ഇന്റർനെറ്റിലെ വിശാലമായ വിവരങ്ങൾ ഉപയോഗിച്ച് വളർന്നതെങ്കിലും, റോബോട്ടിക്സിന് നിലവിലുള്ള ഡാറ്റാസെറ്റുകൾ നൽകാൻ കഴിയാത്ത തരത്തിലുള്ള കൃത്യമായ, ഭൗതികമായ ഇടപെടലുകൾ (physical interaction) അടങ്ങിയ ഡാറ്റ ആവശ്യമാണ്.
ഡാറ്റാ വിടവ്: എന്തുകൊണ്ട് LLM-കൾക്ക് റോബോട്ടിക്സ് പ്രശ്നം പരിഹരിക്കാൻ കഴിയില്ല
കഴിവുള്ള റോബോട്ടുകളെ വികസിപ്പിക്കുന്നതിലെ പ്രധാന തടസ്സം കമ്പ്യൂട്ട് അല്ലെങ്കിൽ മോഡൽ ആർക്കിടെക്ചർ മാത്രമല്ല; മറിച്ച് GPT മോഡലുകൾക്കായി ഉപയോഗിക്കുന്ന ടെക്സ്റ്റ് പോലെ ഉപയോഗിക്കാൻ കഴിയുന്ന ഒരു "ഡാറ്റാ മൗട്ട്" (data moat) ഇല്ലാതിരിക്കുക എന്നതാണ്. യൂട്യൂബ് വീഡിയോകളോ ഗിഗ് വർക്കർമാർ ശേഖരിക്കുന്ന കുറഞ്ഞ നിലവാരമുള്ള ദൃശ്യങ്ങളോ പോലുള്ള നിലവിലെ ബദലങ്ങൾ, റോബോട്ടിക് ചലനങ്ങളുടെ സങ്കീർണ്ണമായ ഭൗതിക യാഥാർത്ഥ്യങ്ങളുമായി യോജിപ്പിക്കാൻ പ്രയാസമാണ്. മോഡലുകൾ പരിശീലിപ്പിക്കാൻ ഡാറ്റ ആവശ്യമാണ്, എന്നാൽ കാര്യക്ഷമമായ ഡാറ്റ ശേഖരിക്കാൻ മോഡലുകൾ ആവശ്യമാണ് എന്ന ഈ "കോഴിയും മുട്ടയും" (chicken-and-egg) പ്രശ്നം ഈ വ്യവസായത്തിന്റെ പ്രധാന തടസ്സമായി മാറിയിരിക്കുന്നു.
സ്റ്റെൽത്ത് മോഡിൽ നിന്ന് പുറത്തുവരുന്ന സ്റ്റാർട്ടപ്പായ XDOF, ഈ പ്രശ്നം പരിഹരിക്കുന്നതിനുള്ള ഇൻഫ്രാസ്ട്രക്ചർ ലെയറായി സ്വയം മാറുകയാണ്. Thrive Capital, Spark Capital, a16z, Lux, WndrCo തുടങ്ങിയ പ്രമുഖ നിക്ഷേപകരിൽ നിന്ന് 70 മില്യൺ ഡോളർ സമാഹരിച്ച കമ്പനി, മുൻനിര AI ലാബുകൾക്ക് സ്വന്തമായി നിർമ്മിക്കാൻ പ്രയാസമുള്ള പൈപ്പ്ലൈനുകൾ, ശേഖരണ ഉപകരണങ്ങൾ, അനോട്ടേഷൻ സംവിധാനങ്ങൾ എന്നിവ നിർമ്മിച്ചുവരികയാണ്.
ABC ഡാറ്റാസെറ്റും ഡാറ്റാ പിരമിഡും നിർമ്മിക്കുന്നു
ഈ ഇക്കോസിസ്റ്റത്തിന് വേഗത കൂട്ടുന്നതിനായി, ഉയർന്ന നിലവാരമുള്ള റോബോട്ട് പരിശീലന ഡാറ്റയുടെ വലിയ ശേഖരമായ "ABC" പുറത്തിറക്കാൻ XDOF, UC ബർക്ക്ലിയിലെ AI റിസർച്ച് ലാബുമായി പങ്കാളിയാവുന്നു. ഈ ഡാറ്റാസെറ്റിൽ ഉൾപ്പെടുന്നവ:
- 130,000 ട്രജക്റ്ററികൾ (trajectories) റോബോട്ട് മാനിപുലേഷൻ ഡാറ്റ.
- 300 മണിക്കൂർ സിമുലേഷൻ ഡാറ്റ.
- 100 മണിക്കൂർ മൂല്യനിർണ്ണയങ്ങൾ (evaluations).
ഈ ഡാറ്റ ഉപയോഗിച്ച്, ടി-ഷർട്ടുകൾ മടക്കുക, ബോക്സുകൾ പരത്തുക, AirPods കേസുകളിലേക്ക് വെക്കുന്നത് പോലുള്ള സൂക്ഷ്മമായ ജോലികൾ ചെയ്യുന്നതിനായി ടീമുകൾ ഇതിനകം തന്നെ റോബോട്ടുകളെ വിജയകരമായി പരിശീലിപ്പിച്ചിട്ടുണ്ട്.
സമഗ്രമായ പഠനം ഉറപ്പാക്കുന്നതിനായി XDOF-ന്റെ തന്ത്രം മൂന്ന് തലങ്ങളുള്ള ഒരു "ഡാറ്റാ പിരമിഡ്" പിന്തുടരുന്നു. ഏറ്റവും മൂല്യവത്തായ ഘട്ടം ലക്ഷ്യമിട്ട റോബോട്ടിൽ നിന്ന് നേരിട്ട് ശേഖരിക്കുന്ന ടെലിഓപ്പറേഷൻ (teleoperation) ഡാറ്റയാണ്. ഇതിനുപിന്നാലെ GELLO (XDOF സഹസ്ഥാപകരായ Philippe Wu, Fred Shentu എന്നിവർ വികസിപ്പിച്ച കുറഞ്ഞ ചിലവിലുള്ള ഒരു ടെലിഓപ്പറേഷൻ സംവിധാനം) പോലുള്ള ഉപകരണങ്ങൾ വഴി ശേഖരിക്കുന്ന പൊതുവായ ഡാറ്റ വരുന്നു. അവസാന ഘട്ടത്തിൽ "എഗോസെൻട്രിക്" (egocentric) ഡാറ്റ ഉൾപ്പെടുന്നു; ഇതിൽ മനുഷ്യർ XDOF-ന്റെ സ്വന്തം സെൻസറുകൾ ധരിച്ച് ദൈനംദിന ജോലികൾ ചെയ്യുമ്പോൾ അവരുടെ വ്യക്തിഗതമായ ഭൗതിക ചലനങ്ങൾ (first-person physical movement) പകർത്തുന്നു.
ഫ്രോണ്ടിയർ ലാബുകളെ മറികടന്ന്
പ്രധാന AI ലാബുകൾ എന്തുകൊണ്ട് ഇത്തരം ഡാറ്റാ ഫാക്ടറികൾ സ്വയം നിർമ്മിക്കുന്നില്ല എന്നത് നിക്ഷേപകർ നേരിടുന്ന ഒരു നിർണ്ണായക ചോദ്യമാണ്. സിഇഒ ഫിലിപ്പ് വുവിന്റെ അഭിപ്രായത്തിൽ, ഇതിന്റെ പ്രവർത്തനപരമായ സങ്കീർണ്ണത വളരെ വലുതാണ്. ഒരു ഡാറ്റാ ശേഖരണ പ്രവർത്തനം നടത്തുന്നതിന് ലക്ഷക്കണക്കിന് ചതുരശ്ര അടി വെയർഹൗസ് സ്ഥലവും, നൂറുകണക്കിന് കാലിബ്രേറ്റ് ചെയ്ത റോബോട്ടുകളും, പരിശീലനം ലഭിച്ച വലിയൊരു ടെലിഓപ്പറേറ്റർ വിഭാഗവും ആവശ്യമാണ്.
ഡാറ്റ ക്ലീനിംഗ്, ഹാർഡ്വെയർ അധിഷ്ഠിത കാലിബ്രേഷൻ എന്നിവയുൾപ്പെടെയുള്ള ഈ "ആകർഷണമില്ലാത്ത" ജോലികളിൽ വൈദഗ്ധ്യം നേടുന്നതിലൂടെ, AI ലാബുകൾക്ക് അവരുടെ മോഡൽ ആർക്കിടെക്ചറിൽ ശ്രദ്ധ കേന്ദ്രീകരിക്കാൻ XDOF അവസരമൊരുക്കുന്നു. അതേസമയം, ഫിസിക്കൽ ഡാറ്റാ ഉൽപ്പാദനത്തിന്റെ വലിയ ലോജിസ്റ്റിക്കൽ ഭാരം XDOF കൈകാര്യം ചെയ്യുന്നു. "degrees of freedom" എന്ന പദത്തിൽ നിന്നാണ് കമ്പനിയുടെ പേര് രൂപപ്പെട്ടത്. ഒരു മനുഷ്യന്റെ കൈയുടെ ഏഴ് ഡിഗ്രീസ് ഓഫ് ഫ്രീഡം മുതൽ ഒരു ഹ്യൂമനോയിഡിന്റെ 30 ഡിഗ്രീസ് ഓഫ് ഫ്രീഡം വരെയുള്ള ഏത് തരത്തിലുള്ള ചലന സങ്കീർണ്ണതയ്ക്കും ആവശ്യമായ ഡാറ്റ നൽകുക എന്നതാണ് ഇതിലൂടെ കമ്പനി ലക്ഷ്യമിടുന്നത്.
പ്രധാന കാര്യങ്ങൾ
- മോഡലുകളേക്കാൾ അടിസ്ഥാന സൗകര്യങ്ങൾക്ക് മുൻഗണന: LLM കേന്ദ്രീകൃതമായ ലാബുകൾക്ക് ലഭ്യമല്ലാത്ത പ്രത്യേക ഡാറ്റാ പൈപ്പ്ലൈനുകളും അനോട്ടേഷൻ ടൂളുകളും നൽകിക്കൊണ്ട് XDOF "ഫിസിക്കൽ AI" രംഗത്തെ തടസ്സങ്ങൾ പരിഹരിക്കുന്നു.
- ഉയർന്ന നിലവാരമുള്ള ഡാറ്റാസെറ്റുകൾ: 1,30,000 മാനിപുലേഷൻ ട്രാജക്റ്ററികൾ ഉൾക്കൊള്ളുന്ന ABC ഡാറ്റാസെറ്റ് പുറത്തിറക്കിയതിലൂടെ വ്യവസായ മേഖലയ്ക്ക് അഭൂതപൂർവമായ ഡാറ്റാ വ്യാപ്തി ലഭ്യമാകുന്നു.
- പ്രവർത്തനങ്ങൾ ഔട്ട്സോഴ്സ് ചെയ്യുക: വലിയ തോതിലുള്ള ഫിസിക്കൽ ഡാറ്റാ വെയർഹൗസുകളും ടെലിഓപ്പറേഷൻ ഫ്ലീറ്റുകളും നിയന്ത്രിക്കുന്നതിന് ആവശ്യമായ വലിയ മൂലധനവും ലോജിസ്റ്റിക്കൽ ബുദ്ധിമുട്ടുകളും ഒഴിവാക്കി മുന്നോട്ട് പോകാൻ XDOF ഫ്രോണ്ടിയർ ലാബുകളെ സഹായിക്കുന്നു.