XDOF Emerges to Solve the Critical Data Bottleneck in Physical AI

📅2 hours ago⏱3 min read

In this article

ഫിസിക്കൽ AI-യിലെ നിർണ്ണായകമായ ഡാറ്റാ തടസ്സം പരിഹരിക്കാൻ XDOF രംഗത്ത് എത്തുന്നു

OpenAI അതിന്റെ റോബോട്ടിക്സ് പ്രോഗ്രാം പുനരാരംഭിച്ചതോടെ ഫിസിക്കൽ ഇന്റലിജൻസിനായുള്ള മത്സരം മുറുകുകയാണ്. ഇതിനോടൊപ്പം തന്നെ ഒരു പുതിയ വെല്ലുവിളിയും ഉയർന്നുവന്നിരിക്കുന്നു: ഉയർന്ന നിലവാരമുള്ള (high-fidelity) പരിശീലന ഡാറ്റയുടെ അഭാവം. ലാർജ് ലാംഗ്വേജ് മോഡലുകൾ (LLMs) പൊതു ഇന്റർനെറ്റിലെ വിശാലമായ വിവരങ്ങൾ ഉപയോഗിച്ച് വളർന്നതെങ്കിലും, റോബോട്ടിക്സിന് നിലവിലുള്ള ഡാറ്റാസെറ്റുകൾ നൽകാൻ കഴിയാത്ത തരത്തിലുള്ള കൃത്യമായ, ഭൗതികമായ ഇടപെടലുകൾ (physical interaction) അടങ്ങിയ ഡാറ്റ ആവശ്യമാണ്.

ഡാറ്റാ വിടവ്: എന്തുകൊണ്ട് LLM-കൾക്ക് റോബോട്ടിക്സ് പ്രശ്നം പരിഹരിക്കാൻ കഴിയില്ല

കഴിവുള്ള റോബോട്ടുകളെ വികസിപ്പിക്കുന്നതിലെ പ്രധാന തടസ്സം കമ്പ്യൂട്ട് അല്ലെങ്കിൽ മോഡൽ ആർക്കിടെക്ചർ മാത്രമല്ല; മറിച്ച് GPT മോഡലുകൾക്കായി ഉപയോഗിക്കുന്ന ടെക്സ്റ്റ് പോലെ ഉപയോഗിക്കാൻ കഴിയുന്ന ഒരു "ഡാറ്റാ മൗട്ട്" (data moat) ഇല്ലാതിരിക്കുക എന്നതാണ്. യൂട്യൂബ് വീഡിയോകളോ ഗിഗ് വർക്കർമാർ ശേഖരിക്കുന്ന കുറഞ്ഞ നിലവാരമുള്ള ദൃശ്യങ്ങളോ പോലുള്ള നിലവിലെ ബദലങ്ങൾ, റോബോട്ടിക് ചലനങ്ങളുടെ സങ്കീർണ്ണമായ ഭൗതിക യാഥാർത്ഥ്യങ്ങളുമായി യോജിപ്പിക്കാൻ പ്രയാസമാണ്. മോഡലുകൾ പരിശീലിപ്പിക്കാൻ ഡാറ്റ ആവശ്യമാണ്, എന്നാൽ കാര്യക്ഷമമായ ഡാറ്റ ശേഖരിക്കാൻ മോഡലുകൾ ആവശ്യമാണ് എന്ന ഈ "കോഴിയും മുട്ടയും" (chicken-and-egg) പ്രശ്നം ഈ വ്യവസായത്തിന്റെ പ്രധാന തടസ്സമായി മാറിയിരിക്കുന്നു.

സ്റ്റെൽത്ത് മോഡിൽ നിന്ന് പുറത്തുവരുന്ന സ്റ്റാർട്ടപ്പായ XDOF, ഈ പ്രശ്നം പരിഹരിക്കുന്നതിനുള്ള ഇൻഫ്രാസ്ട്രക്ചർ ലെയറായി സ്വയം മാറുകയാണ്. Thrive Capital, Spark Capital, a16z, Lux, WndrCo തുടങ്ങിയ പ്രമുഖ നിക്ഷേപകരിൽ നിന്ന് 70 മില്യൺ ഡോളർ സമാഹരിച്ച കമ്പനി, മുൻനിര AI ലാബുകൾക്ക് സ്വന്തമായി നിർമ്മിക്കാൻ പ്രയാസമുള്ള പൈപ്പ്‌ലൈനുകൾ, ശേഖരണ ഉപകരണങ്ങൾ, അനോട്ടേഷൻ സംവിധാനങ്ങൾ എന്നിവ നിർമ്മിച്ചുവരികയാണ്.

ABC ഡാറ്റാസെറ്റും ഡാറ്റാ പിരമിഡും നിർമ്മിക്കുന്നു

ഈ ഇക്കോസിസ്റ്റത്തിന് വേഗത കൂട്ടുന്നതിനായി, ഉയർന്ന നിലവാരമുള്ള റോബോട്ട് പരിശീലന ഡാറ്റയുടെ വലിയ ശേഖരമായ "ABC" പുറത്തിറക്കാൻ XDOF, UC ബർക്ക്ലിയിലെ AI റിസർച്ച് ലാബുമായി പങ്കാളിയാവുന്നു. ഈ ഡാറ്റാസെറ്റിൽ ഉൾപ്പെടുന്നവ:

130,000 ട്രജക്റ്ററികൾ (trajectories) റോബോട്ട് മാനിപുലേഷൻ ഡാറ്റ.
300 മണിക്കൂർ സിമുലേഷൻ ഡാറ്റ.
100 മണിക്കൂർ മൂല്യനിർണ്ണയങ്ങൾ (evaluations).

ഈ ഡാറ്റ ഉപയോഗിച്ച്, ടി-ഷർട്ടുകൾ മടക്കുക, ബോക്സുകൾ പരത്തുക, AirPods കേസുകളിലേക്ക് വെക്കുന്നത് പോലുള്ള സൂക്ഷ്മമായ ജോലികൾ ചെയ്യുന്നതിനായി ടീമുകൾ ഇതിനകം തന്നെ റോബോട്ടുകളെ വിജയകരമായി പരിശീലിപ്പിച്ചിട്ടുണ്ട്.

സമഗ്രമായ പഠനം ഉറപ്പാക്കുന്നതിനായി XDOF-ന്റെ തന്ത്രം മൂന്ന് തലങ്ങളുള്ള ഒരു "ഡാറ്റാ പിരമിഡ്" പിന്തുടരുന്നു. ഏറ്റവും മൂല്യവത്തായ ഘട്ടം ലക്ഷ്യമിട്ട റോബോട്ടിൽ നിന്ന് നേരിട്ട് ശേഖരിക്കുന്ന ടെലിഓപ്പറേഷൻ (teleoperation) ഡാറ്റയാണ്. ഇതിനുപിന്നാലെ GELLO (XDOF സഹസ്ഥാപകരായ Philippe Wu, Fred Shentu എന്നിവർ വികസിപ്പിച്ച കുറഞ്ഞ ചിലവിലുള്ള ഒരു ടെലിഓപ്പറേഷൻ സംവിധാനം) പോലുള്ള ഉപകരണങ്ങൾ വഴി ശേഖരിക്കുന്ന പൊതുവായ ഡാറ്റ വരുന്നു. അവസാന ഘട്ടത്തിൽ "എഗോസെൻട്രിക്" (egocentric) ഡാറ്റ ഉൾപ്പെടുന്നു; ഇതിൽ മനുഷ്യർ XDOF-ന്റെ സ്വന്തം സെൻസറുകൾ ധരിച്ച് ദൈനംദിന ജോലികൾ ചെയ്യുമ്പോൾ അവരുടെ വ്യക്തിഗതമായ ഭൗതിക ചലനങ്ങൾ (first-person physical movement) പകർത്തുന്നു.

ഫ്രോണ്ടിയർ ലാബുകളെ മറികടന്ന്

പ്രധാന AI ലാബുകൾ എന്തുകൊണ്ട് ഇത്തരം ഡാറ്റാ ഫാക്ടറികൾ സ്വയം നിർമ്മിക്കുന്നില്ല എന്നത് നിക്ഷേപകർ നേരിടുന്ന ഒരു നിർണ്ണായക ചോദ്യമാണ്. സിഇഒ ഫിലിപ്പ് വുവിന്റെ അഭിപ്രായത്തിൽ, ഇതിന്റെ പ്രവർത്തനപരമായ സങ്കീർണ്ണത വളരെ വലുതാണ്. ഒരു ഡാറ്റാ ശേഖരണ പ്രവർത്തനം നടത്തുന്നതിന് ലക്ഷക്കണക്കിന് ചതുരശ്ര അടി വെയർഹൗസ് സ്ഥലവും, നൂറുകണക്കിന് കാലിബ്രേറ്റ് ചെയ്ത റോബോട്ടുകളും, പരിശീലനം ലഭിച്ച വലിയൊരു ടെലിഓപ്പറേറ്റർ വിഭാഗവും ആവശ്യമാണ്.

ഡാറ്റ ക്ലീനിംഗ്, ഹാർഡ്‌വെയർ അധിഷ്ഠിത കാലിബ്രേഷൻ എന്നിവയുൾപ്പെടെയുള്ള ഈ "ആകർഷണമില്ലാത്ത" ജോലികളിൽ വൈദഗ്ധ്യം നേടുന്നതിലൂടെ, AI ലാബുകൾക്ക് അവരുടെ മോഡൽ ആർക്കിടെക്ചറിൽ ശ്രദ്ധ കേന്ദ്രീകരിക്കാൻ XDOF അവസരമൊരുക്കുന്നു. അതേസമയം, ഫിസിക്കൽ ഡാറ്റാ ഉൽപ്പാദനത്തിന്റെ വലിയ ലോജിസ്റ്റിക്കൽ ഭാരം XDOF കൈകാര്യം ചെയ്യുന്നു. "degrees of freedom" എന്ന പദത്തിൽ നിന്നാണ് കമ്പനിയുടെ പേര് രൂപപ്പെട്ടത്. ഒരു മനുഷ്യന്റെ കൈയുടെ ഏഴ് ഡിഗ്രീസ് ഓഫ് ഫ്രീഡം മുതൽ ഒരു ഹ്യൂമനോയിഡിന്റെ 30 ഡിഗ്രീസ് ഓഫ് ഫ്രീഡം വരെയുള്ള ഏത് തരത്തിലുള്ള ചലന സങ്കീർണ്ണതയ്ക്കും ആവശ്യമായ ഡാറ്റ നൽകുക എന്നതാണ് ഇതിലൂടെ കമ്പനി ലക്ഷ്യമിടുന്നത്.

പ്രധാന കാര്യങ്ങൾ

മോഡലുകളേക്കാൾ അടിസ്ഥാന സൗകര്യങ്ങൾക്ക് മുൻഗണന: LLM കേന്ദ്രീകൃതമായ ലാബുകൾക്ക് ലഭ്യമല്ലാത്ത പ്രത്യേക ഡാറ്റാ പൈപ്പ്‌ലൈനുകളും അനോട്ടേഷൻ ടൂളുകളും നൽകിക്കൊണ്ട് XDOF "ഫിസിക്കൽ AI" രംഗത്തെ തടസ്സങ്ങൾ പരിഹരിക്കുന്നു.
ഉയർന്ന നിലവാരമുള്ള ഡാറ്റാസെറ്റുകൾ: 1,30,000 മാനിപുലേഷൻ ട്രാജക്റ്ററികൾ ഉൾക്കൊള്ളുന്ന ABC ഡാറ്റാസെറ്റ് പുറത്തിറക്കിയതിലൂടെ വ്യവസായ മേഖലയ്ക്ക് അഭൂതപൂർവമായ ഡാറ്റാ വ്യാപ്തി ലഭ്യമാകുന്നു.
പ്രവർത്തനങ്ങൾ ഔട്ട്‌സോഴ്‌സ് ചെയ്യുക: വലിയ തോതിലുള്ള ഫിസിക്കൽ ഡാറ്റാ വെയർഹൗസുകളും ടെലിഓപ്പറേഷൻ ഫ്ലീറ്റുകളും നിയന്ത്രിക്കുന്നതിന് ആവശ്യമായ വലിയ മൂലധനവും ലോജിസ്റ്റിക്കൽ ബുദ്ധിമുട്ടുകളും ഒഴിവാക്കി മുന്നോട്ട് പോകാൻ XDOF ഫ്രോണ്ടിയർ ലാബുകളെ സഹായിക്കുന്നു.

XDOF Emerges to Solve the Critical Data Bottleneck in Physical AI

ഫിസിക്കൽ AI-യിലെ നിർണ്ണായകമായ ഡാറ്റാ തടസ്സം പരിഹരിക്കാൻ XDOF രംഗത്ത് എത്തുന്നു

ഡാറ്റാ വിടവ്: എന്തുകൊണ്ട് LLM-കൾക്ക് റോബോട്ടിക്സ് പ്രശ്നം പരിഹരിക്കാൻ കഴിയില്ല

ABC ഡാറ്റാസെറ്റും ഡാറ്റാ പിരമിഡും നിർമ്മിക്കുന്നു

ഫ്രോണ്ടിയർ ലാബുകളെ മറികടന്ന്

പ്രധാന കാര്യങ്ങൾ

Continue reading

How AI Flexibility Could Solve the Global Data Center Power Crunch

𝗔𝗜 𝗚𝗮𝘁𝗲𝘄𝗮𝘆: 𝗧𝗵𝗲 𝗖𝗲𝗻𝘁𝗿𝗮𝗹 𝗡𝗲𝗿𝘃𝗼𝘂𝘀 𝗦𝘆𝘀𝘁𝗲𝗺 𝗳𝗼𝗿 𝗘𝗻𝘁𝗲𝗿𝗽𝗿𝗶𝘀𝗲 𝗟𝗟𝗠𝘀

എഐ ഡാറ്റാ സജ്ജതയിലെ വിടവ്

AI ഇൻഫ്രാസ്ട്രക്ചർ വിടവ്: പണലഭ്യത പ്രതിസന്ധി നേരിടുന്ന ഹൈപ്പർസ്കെയിലർമാർ

ഫോർമൽ വെരിഫിക്കേഷനിലൂടെ AI വിശ്വാസ്യത ഉറപ്പാക്കാൻ Pramaana Labs 27 മില്യൺ ഡോളർ സമാഹരിച്ചു