ഫിസിക്കൽ AI-യിലെ നിർണ്ണായകമായ ഡാറ്റാ തടസ്സം പരിഹരിക്കാൻ XDOF രംഗത്ത് എത്തുന്നു

OpenAI അതിന്റെ റോബോട്ടിക്സ് പ്രോഗ്രാം പുനരാരംഭിച്ചതോടെ ഫിസിക്കൽ ഇന്റലിജൻസിനായുള്ള മത്സരം മുറുകുകയാണ്. ഇതിനോടൊപ്പം തന്നെ ഒരു പുതിയ വെല്ലുവിളിയും ഉയർന്നുവന്നിരിക്കുന്നു: ഉയർന്ന നിലവാരമുള്ള (high-fidelity) പരിശീലന ഡാറ്റയുടെ അഭാവം. ലാർജ് ലാംഗ്വേജ് മോഡലുകൾ (LLMs) പൊതു ഇന്റർനെറ്റിലെ വിശാലമായ വിവരങ്ങൾ ഉപയോഗിച്ച് വളർന്നതെങ്കിലും, റോബോട്ടിക്സിന് നിലവിലുള്ള ഡാറ്റാസെറ്റുകൾ നൽകാൻ കഴിയാത്ത തരത്തിലുള്ള കൃത്യമായ, ഭൗതികമായ ഇടപെടലുകൾ (physical interaction) അടങ്ങിയ ഡാറ്റ ആവശ്യമാണ്.

ഡാറ്റാ വിടവ്: എന്തുകൊണ്ട് LLM-കൾക്ക് റോബോട്ടിക്സ് പ്രശ്നം പരിഹരിക്കാൻ കഴിയില്ല

കഴിവുള്ള റോബോട്ടുകളെ വികസിപ്പിക്കുന്നതിലെ പ്രധാന തടസ്സം കമ്പ്യൂട്ട് അല്ലെങ്കിൽ മോഡൽ ആർക്കിടെക്ചർ മാത്രമല്ല; മറിച്ച് GPT മോഡലുകൾക്കായി ഉപയോഗിക്കുന്ന ടെക്സ്റ്റ് പോലെ ഉപയോഗിക്കാൻ കഴിയുന്ന ഒരു "ഡാറ്റാ മൗട്ട്" (data moat) ഇല്ലാതിരിക്കുക എന്നതാണ്. യൂട്യൂബ് വീഡിയോകളോ ഗിഗ് വർക്കർമാർ ശേഖരിക്കുന്ന കുറഞ്ഞ നിലവാരമുള്ള ദൃശ്യങ്ങളോ പോലുള്ള നിലവിലെ ബദലങ്ങൾ, റോബോട്ടിക് ചലനങ്ങളുടെ സങ്കീർണ്ണമായ ഭൗതിക യാഥാർത്ഥ്യങ്ങളുമായി യോജിപ്പിക്കാൻ പ്രയാസമാണ്. മോഡലുകൾ പരിശീലിപ്പിക്കാൻ ഡാറ്റ ആവശ്യമാണ്, എന്നാൽ കാര്യക്ഷമമായ ഡാറ്റ ശേഖരിക്കാൻ മോഡലുകൾ ആവശ്യമാണ് എന്ന ഈ "കോഴിയും മുട്ടയും" (chicken-and-egg) പ്രശ്നം ഈ വ്യവസായത്തിന്റെ പ്രധാന തടസ്സമായി മാറിയിരിക്കുന്നു.

സ്റ്റെൽത്ത് മോഡിൽ നിന്ന് പുറത്തുവരുന്ന സ്റ്റാർട്ടപ്പായ XDOF, ഈ പ്രശ്നം പരിഹരിക്കുന്നതിനുള്ള ഇൻഫ്രാസ്ട്രക്ചർ ലെയറായി സ്വയം മാറുകയാണ്. Thrive Capital, Spark Capital, a16z, Lux, WndrCo തുടങ്ങിയ പ്രമുഖ നിക്ഷേപകരിൽ നിന്ന് 70 മില്യൺ ഡോളർ സമാഹരിച്ച കമ്പനി, മുൻനിര AI ലാബുകൾക്ക് സ്വന്തമായി നിർമ്മിക്കാൻ പ്രയാസമുള്ള പൈപ്പ്‌ലൈനുകൾ, ശേഖരണ ഉപകരണങ്ങൾ, അനോട്ടേഷൻ സംവിധാനങ്ങൾ എന്നിവ നിർമ്മിച്ചുവരികയാണ്.

ABC ഡാറ്റാസെറ്റും ഡാറ്റാ പിരമിഡും നിർമ്മിക്കുന്നു

ഈ ഇക്കോസിസ്റ്റത്തിന് വേഗത കൂട്ടുന്നതിനായി, ഉയർന്ന നിലവാരമുള്ള റോബോട്ട് പരിശീലന ഡാറ്റയുടെ വലിയ ശേഖരമായ "ABC" പുറത്തിറക്കാൻ XDOF, UC ബർക്ക്ലിയിലെ AI റിസർച്ച് ലാബുമായി പങ്കാളിയാവുന്നു. ഈ ഡാറ്റാസെറ്റിൽ ഉൾപ്പെടുന്നവ:

ഈ ഡാറ്റ ഉപയോഗിച്ച്, ടി-ഷർട്ടുകൾ മടക്കുക, ബോക്സുകൾ പരത്തുക, AirPods കേസുകളിലേക്ക് വെക്കുന്നത് പോലുള്ള സൂക്ഷ്മമായ ജോലികൾ ചെയ്യുന്നതിനായി ടീമുകൾ ഇതിനകം തന്നെ റോബോട്ടുകളെ വിജയകരമായി പരിശീലിപ്പിച്ചിട്ടുണ്ട്.

സമഗ്രമായ പഠനം ഉറപ്പാക്കുന്നതിനായി XDOF-ന്റെ തന്ത്രം മൂന്ന് തലങ്ങളുള്ള ഒരു "ഡാറ്റാ പിരമിഡ്" പിന്തുടരുന്നു. ഏറ്റവും മൂല്യവത്തായ ഘട്ടം ലക്ഷ്യമിട്ട റോബോട്ടിൽ നിന്ന് നേരിട്ട് ശേഖരിക്കുന്ന ടെലിഓപ്പറേഷൻ (teleoperation) ഡാറ്റയാണ്. ഇതിനുപിന്നാലെ GELLO (XDOF സഹസ്ഥാപകരായ Philippe Wu, Fred Shentu എന്നിവർ വികസിപ്പിച്ച കുറഞ്ഞ ചിലവിലുള്ള ഒരു ടെലിഓപ്പറേഷൻ സംവിധാനം) പോലുള്ള ഉപകരണങ്ങൾ വഴി ശേഖരിക്കുന്ന പൊതുവായ ഡാറ്റ വരുന്നു. അവസാന ഘട്ടത്തിൽ "എഗോസെൻട്രിക്" (egocentric) ഡാറ്റ ഉൾപ്പെടുന്നു; ഇതിൽ മനുഷ്യർ XDOF-ന്റെ സ്വന്തം സെൻസറുകൾ ധരിച്ച് ദൈനംദിന ജോലികൾ ചെയ്യുമ്പോൾ അവരുടെ വ്യക്തിഗതമായ ഭൗതിക ചലനങ്ങൾ (first-person physical movement) പകർത്തുന്നു.

ഫ്രോണ്ടിയർ ലാബുകളെ മറികടന്ന്

പ്രധാന AI ലാബുകൾ എന്തുകൊണ്ട് ഇത്തരം ഡാറ്റാ ഫാക്ടറികൾ സ്വയം നിർമ്മിക്കുന്നില്ല എന്നത് നിക്ഷേപകർ നേരിടുന്ന ഒരു നിർണ്ണായക ചോദ്യമാണ്. സിഇഒ ഫിലിപ്പ് വുവിന്റെ അഭിപ്രായത്തിൽ, ഇതിന്റെ പ്രവർത്തനപരമായ സങ്കീർണ്ണത വളരെ വലുതാണ്. ഒരു ഡാറ്റാ ശേഖരണ പ്രവർത്തനം നടത്തുന്നതിന് ലക്ഷക്കണക്കിന് ചതുരശ്ര അടി വെയർഹൗസ് സ്ഥലവും, നൂറുകണക്കിന് കാലിബ്രേറ്റ് ചെയ്ത റോബോട്ടുകളും, പരിശീലനം ലഭിച്ച വലിയൊരു ടെലിഓപ്പറേറ്റർ വിഭാഗവും ആവശ്യമാണ്.

ഡാറ്റ ക്ലീനിംഗ്, ഹാർഡ്‌വെയർ അധിഷ്ഠിത കാലിബ്രേഷൻ എന്നിവയുൾപ്പെടെയുള്ള ഈ "ആകർഷണമില്ലാത്ത" ജോലികളിൽ വൈദഗ്ധ്യം നേടുന്നതിലൂടെ, AI ലാബുകൾക്ക് അവരുടെ മോഡൽ ആർക്കിടെക്ചറിൽ ശ്രദ്ധ കേന്ദ്രീകരിക്കാൻ XDOF അവസരമൊരുക്കുന്നു. അതേസമയം, ഫിസിക്കൽ ഡാറ്റാ ഉൽപ്പാദനത്തിന്റെ വലിയ ലോജിസ്റ്റിക്കൽ ഭാരം XDOF കൈകാര്യം ചെയ്യുന്നു. "degrees of freedom" എന്ന പദത്തിൽ നിന്നാണ് കമ്പനിയുടെ പേര് രൂപപ്പെട്ടത്. ഒരു മനുഷ്യന്റെ കൈയുടെ ഏഴ് ഡിഗ്രീസ് ഓഫ് ഫ്രീഡം മുതൽ ഒരു ഹ്യൂമനോയിഡിന്റെ 30 ഡിഗ്രീസ് ഓഫ് ഫ്രീഡം വരെയുള്ള ഏത് തരത്തിലുള്ള ചലന സങ്കീർണ്ണതയ്ക്കും ആവശ്യമായ ഡാറ്റ നൽകുക എന്നതാണ് ഇതിലൂടെ കമ്പനി ലക്ഷ്യമിടുന്നത്.

പ്രധാന കാര്യങ്ങൾ