Physical AI-இல் உள்ள முக்கியமான தரவுத் தடையைத் தீர்க்க XDOF உருவாகிறது

OpenAI தனது ரோபோட்டிக்ஸ் திட்டத்தை மீண்டும் தொடங்கியுள்ள நிலையில், physical intelligenceக்கான போட்டி தீவிரமடைந்து வருகிறது. இதனுடன் ஒரு புதிய சவாலும் உருவாகியுள்ளது: அது உயர்தரப் பயிற்சித் தரவுகளின் (high-fidelity training data) பற்றாக்குறை. Large Language Models (LLMs) பொது இணையத்தின் பரந்த பரப்பைப் பயன்படுத்தி செழித்து வளர்ந்தன, ஆனால் ரோபோட்டிக்ஸிற்குத் துல்லியமான, இயற்பியல் ரீதியான தொடர்புத் தரவுகள் (physical interaction data) தேவைப்படுகின்றன, அவற்றை தற்போதைய தரவுத்தொகுப்புகளால் வழங்க முடியாது.

தரவு இடைவெளி: ஏன் LLM-கள் ரோபோட்டிக்ஸ் சிக்கலைத் தீர்க்காது

திறமையான ரோபோக்களை உருவாக்குவதில் உள்ள முதன்மையான தடையானது வெறும் கணினித் திறன் (compute) அல்லது மாடல் கட்டமைப்பு (model architecture) மட்டுமல்ல; அது GPT மாடல்களுக்குப் பயன்படுத்தப்படும் உரையைப் போன்ற ஒரு "தரவு அகழி" (data moat) இல்லாமையும்கூட. YouTube வீடியோக்கள் அல்லது கிக் தொழிலாளர்களால் (gig workers) எடுக்கப்பட்ட குறைந்த தரமான காட்சிகள் போன்ற தற்போதைய மாற்றுகள், ரோபோட்டிக் இயக்கத்தின் சிக்கலான இயற்பியல் யதார்த்தங்களுடன் ஒத்துப்போவது கடினம். மாடல்களைப் பயிற்றுவிக்கத் தரவு தேவை, ஆனால் திறமையான தரவைச் சேகரிக்க மாடல்கள் தேவை என்ற இந்த "முட்டை அல்லது கோழி" (chicken-and-egg) சிக்கல், இந்தத் தொழில்துறையின் முதன்மையான தடையாக மாறியுள்ளது.

ரகசியப் பணி நிலையில் இருந்து வெளிவந்துள்ள ஸ்டார்ட்அப் நிறுவனமான XDOF, இந்தச் சிக்கலைத் தீர்ப்பதற்கான உள்கட்டமைப்பு அடுக்காக (infrastructure layer) தன்னை நிலைநிறுத்திக் கொள்கிறது. Thrive Capital, Spark Capital, a16z, Lux மற்றும் WndrCo உள்ளிட்ட முன்னணி நிறுவனங்களிடமிருந்து $70 மில்லியன் நிதி திரட்டியுள்ள இந்நிறுவனம், முன்னணி AI ஆய்வகங்கள் சொந்தமாக உருவாக்கத் திணறும் పైప్‌லைன்கள் (pipelines), சேகரிப்பு கருவிகள் மற்றும் அனோடேஷன் அமைப்புகளை (annotation systems) உருவாக்கி வருகிறது.

ABC தரவுத்தொகுப்பு மற்றும் தரவு பிரமிடை உருவாக்குதல்

இந்தச் சூழலைத் (ecosystem) துரிதப்படுத்த, XDOF நிறுவனம் UC Berkeley-யின் AI ஆராய்ச்சி ஆய்வகத்துடன் இணைந்து, உயர்தர ரோபோ பயிற்சித் தரவுகளின் பிரம்மாண்டமான தொகுப்பான "ABC"-யை வெளியிட உள்ளது. இந்தத் தரவுத்தொகுப்பில் பின்வருவன அடங்கும்:

இந்தத் தரவைப் பயன்படுத்தி, டி-ஷர்ட்களை மடித்தல், பெட்டிகளைத் தட்டையாக்குதல் மற்றும் AirPods-களை அவற்றின் பெட்டிகளில் வைப்பது போன்ற நுணுக்கமான செயல்பாடுகளைச் செய்தல் போன்ற பணிகளில் ரோபோக்களுக்கு ஏற்கனவே வெற்றிகரமாகப் பயிற்சி அளிக்கப்பட்டுள்ளது.

முழுமையான கற்றலை உறுதி செய்ய, XDOF-இன் உத்தி மூன்று அடுக்குகள் கொண்ட "தரவு பிரமிடு" (data pyramid) முறையைப் பின்பற்றுகிறது. மிகவும் மதிப்புமிக்க அடுக்கு என்பது இலக்கு ரோபோவில் நேரடியாகச் சேகரிக்கப்பட்ட டெலிஆப்பரேஷன் தரவுகளை (teleoperation data) உள்ளடக்கியது. இதனைத் தொடர்ந்து, GELLO (XDOF இணை நிறுவனர்களான Philippe Wu மற்றும் Fred Shentu ஆகியோரால் உருவாக்கப்பட்ட குறைந்த செலவிலான டெலிஆப்பரேஷன் அமைப்பு) போன்ற சாதனங்கள் மூலம் சேகரிக்கப்பட்ட பொதுவான தரவுகள் வருகின்றன. இறுதி அடுக்கு "egocentric" தரவுகளை உள்ளடக்கியது; இதில் மனிதர்கள் XDOF-இன் பிரத்யேக சென்சார்களை அணிந்து அன்றாடப் பணிகளைச் செய்யும்போது, அவர்களின் முதல் நபர் பார்வையில் (first-person) இயற்பியல் இயக்கங்கள் பதிவு செய்யப்படுகின்றன.

எல்லை ஆய்வகங்களை முந்துதல்

முதலீட்டாளர்களுக்கு ஒரு முக்கியமான கேள்வி என்னவென்றால், ஏன் பெரிய AI ஆய்வகங்கள் இத்தகைய தரவுத் தொழிற்சாலைகளைத் தாங்களே உருவாக்கவில்லை என்பதுதான். CEO Philippe Wu-வின் கருத்துப்படி, இதன் செயல்பாட்டுச் சிக்கல் மிகப்பெரியது. தரவு சேகரிப்புச் செயல்பாட்டை நடத்துவதற்கு பல லட்சம் சதுர அடி கிடங்கு வசதி, நூற்றுக்கணக்கான அளவுத்திருத்தப்பட்ட (calibrated) ரோபோக்கள் மற்றும் தொலைநிலை இயக்குபவர்களின் (teleoperators) மிகப்பெரிய, பயிற்சி பெற்ற பணியாளர்கள் தேவைப்படுகிறார்கள்.

தரவு சுத்திகரிப்பு மற்றும் வன்பொருள் சார்ந்த அளவுத்திருத்தம் (hardware-specific calibration) போன்ற இந்த "கவர்ச்சியற்ற" (unglamorous) பணிகளில் நிபுணத்துவம் பெறுவதன் மூலம், XDOF நிறுவனமானது AI ஆய்வகங்கள் அவற்றின் மாதிரி கட்டமைப்பில் (model architecture) கவனம் செலுத்த அனுமதிக்கிறது; அதே நேரத்தில், இயற்பியல் தரவு உற்பத்தியின் மிகப்பெரிய தளவாடச் சுமையைத் தாள்கிறது. "degrees of freedom" என்பதிலிருந்து உருவான இந்த நிறுவனத்தின் பெயர், மனிதக் கையின் ஏழு degrees of freedom-லிருந்து ஒரு humanoid-ன் 30 வரை, எந்தவொரு சிக்கலான இயக்கத்திற்கும் தரவை வழங்கும் அதன் இலக்கைப் பிரதிபலிக்கிறது.

முக்கியக் கருத்துக்கள்