இயற்பியல் AI-இல் உள்ள முக்கியமான தரவுத் தடையைத் தீர்க்க XDOF உருவாகிறது

📅4 hours ago⏱3 min read

In this article

Physical AI-இல் உள்ள முக்கியமான தரவுத் தடையைத் தீர்க்க XDOF உருவாகிறது

OpenAI தனது ரோபோட்டிக்ஸ் திட்டத்தை மீண்டும் தொடங்கியுள்ள நிலையில், physical intelligenceக்கான போட்டி தீவிரமடைந்து வருகிறது. இதனுடன் ஒரு புதிய சவாலும் உருவாகியுள்ளது: அது உயர்தரப் பயிற்சித் தரவுகளின் (high-fidelity training data) பற்றாக்குறை. Large Language Models (LLMs) பொது இணையத்தின் பரந்த பரப்பைப் பயன்படுத்தி செழித்து வளர்ந்தன, ஆனால் ரோபோட்டிக்ஸிற்குத் துல்லியமான, இயற்பியல் ரீதியான தொடர்புத் தரவுகள் (physical interaction data) தேவைப்படுகின்றன, அவற்றை தற்போதைய தரவுத்தொகுப்புகளால் வழங்க முடியாது.

தரவு இடைவெளி: ஏன் LLM-கள் ரோபோட்டிக்ஸ் சிக்கலைத் தீர்க்காது

திறமையான ரோபோக்களை உருவாக்குவதில் உள்ள முதன்மையான தடையானது வெறும் கணினித் திறன் (compute) அல்லது மாடல் கட்டமைப்பு (model architecture) மட்டுமல்ல; அது GPT மாடல்களுக்குப் பயன்படுத்தப்படும் உரையைப் போன்ற ஒரு "தரவு அகழி" (data moat) இல்லாமையும்கூட. YouTube வீடியோக்கள் அல்லது கிக் தொழிலாளர்களால் (gig workers) எடுக்கப்பட்ட குறைந்த தரமான காட்சிகள் போன்ற தற்போதைய மாற்றுகள், ரோபோட்டிக் இயக்கத்தின் சிக்கலான இயற்பியல் யதார்த்தங்களுடன் ஒத்துப்போவது கடினம். மாடல்களைப் பயிற்றுவிக்கத் தரவு தேவை, ஆனால் திறமையான தரவைச் சேகரிக்க மாடல்கள் தேவை என்ற இந்த "முட்டை அல்லது கோழி" (chicken-and-egg) சிக்கல், இந்தத் தொழில்துறையின் முதன்மையான தடையாக மாறியுள்ளது.

ரகசியப் பணி நிலையில் இருந்து வெளிவந்துள்ள ஸ்டார்ட்அப் நிறுவனமான XDOF, இந்தச் சிக்கலைத் தீர்ப்பதற்கான உள்கட்டமைப்பு அடுக்காக (infrastructure layer) தன்னை நிலைநிறுத்திக் கொள்கிறது. Thrive Capital, Spark Capital, a16z, Lux மற்றும் WndrCo உள்ளிட்ட முன்னணி நிறுவனங்களிடமிருந்து $70 மில்லியன் நிதி திரட்டியுள்ள இந்நிறுவனம், முன்னணி AI ஆய்வகங்கள் சொந்தமாக உருவாக்கத் திணறும் పైప్‌லைன்கள் (pipelines), சேகரிப்பு கருவிகள் மற்றும் அனோடேஷன் அமைப்புகளை (annotation systems) உருவாக்கி வருகிறது.

ABC தரவுத்தொகுப்பு மற்றும் தரவு பிரமிடை உருவாக்குதல்

இந்தச் சூழலைத் (ecosystem) துரிதப்படுத்த, XDOF நிறுவனம் UC Berkeley-யின் AI ஆராய்ச்சி ஆய்வகத்துடன் இணைந்து, உயர்தர ரோபோ பயிற்சித் தரவுகளின் பிரம்மாண்டமான தொகுப்பான "ABC"-யை வெளியிட உள்ளது. இந்தத் தரவுத்தொகுப்பில் பின்வருவன அடங்கும்:

130,000 ரோபோ கையாளுதல் தரவுப் பாதைகள் (trajectories).
300 மணிநேர சிமுலேஷன் தரவுகள் (simulation data).
100 மணிநேர மதிப்பீடுகள் (evaluations).

இந்தத் தரவைப் பயன்படுத்தி, டி-ஷர்ட்களை மடித்தல், பெட்டிகளைத் தட்டையாக்குதல் மற்றும் AirPods-களை அவற்றின் பெட்டிகளில் வைப்பது போன்ற நுணுக்கமான செயல்பாடுகளைச் செய்தல் போன்ற பணிகளில் ரோபோக்களுக்கு ஏற்கனவே வெற்றிகரமாகப் பயிற்சி அளிக்கப்பட்டுள்ளது.

முழுமையான கற்றலை உறுதி செய்ய, XDOF-இன் உத்தி மூன்று அடுக்குகள் கொண்ட "தரவு பிரமிடு" (data pyramid) முறையைப் பின்பற்றுகிறது. மிகவும் மதிப்புமிக்க அடுக்கு என்பது இலக்கு ரோபோவில் நேரடியாகச் சேகரிக்கப்பட்ட டெலிஆப்பரேஷன் தரவுகளை (teleoperation data) உள்ளடக்கியது. இதனைத் தொடர்ந்து, GELLO (XDOF இணை நிறுவனர்களான Philippe Wu மற்றும் Fred Shentu ஆகியோரால் உருவாக்கப்பட்ட குறைந்த செலவிலான டெலிஆப்பரேஷன் அமைப்பு) போன்ற சாதனங்கள் மூலம் சேகரிக்கப்பட்ட பொதுவான தரவுகள் வருகின்றன. இறுதி அடுக்கு "egocentric" தரவுகளை உள்ளடக்கியது; இதில் மனிதர்கள் XDOF-இன் பிரத்யேக சென்சார்களை அணிந்து அன்றாடப் பணிகளைச் செய்யும்போது, அவர்களின் முதல் நபர் பார்வையில் (first-person) இயற்பியல் இயக்கங்கள் பதிவு செய்யப்படுகின்றன.

எல்லை ஆய்வகங்களை முந்துதல்

முதலீட்டாளர்களுக்கு ஒரு முக்கியமான கேள்வி என்னவென்றால், ஏன் பெரிய AI ஆய்வகங்கள் இத்தகைய தரவுத் தொழிற்சாலைகளைத் தாங்களே உருவாக்கவில்லை என்பதுதான். CEO Philippe Wu-வின் கருத்துப்படி, இதன் செயல்பாட்டுச் சிக்கல் மிகப்பெரியது. தரவு சேகரிப்புச் செயல்பாட்டை நடத்துவதற்கு பல லட்சம் சதுர அடி கிடங்கு வசதி, நூற்றுக்கணக்கான அளவுத்திருத்தப்பட்ட (calibrated) ரோபோக்கள் மற்றும் தொலைநிலை இயக்குபவர்களின் (teleoperators) மிகப்பெரிய, பயிற்சி பெற்ற பணியாளர்கள் தேவைப்படுகிறார்கள்.

தரவு சுத்திகரிப்பு மற்றும் வன்பொருள் சார்ந்த அளவுத்திருத்தம் (hardware-specific calibration) போன்ற இந்த "கவர்ச்சியற்ற" (unglamorous) பணிகளில் நிபுணத்துவம் பெறுவதன் மூலம், XDOF நிறுவனமானது AI ஆய்வகங்கள் அவற்றின் மாதிரி கட்டமைப்பில் (model architecture) கவனம் செலுத்த அனுமதிக்கிறது; அதே நேரத்தில், இயற்பியல் தரவு உற்பத்தியின் மிகப்பெரிய தளவாடச் சுமையைத் தாள்கிறது. "degrees of freedom" என்பதிலிருந்து உருவான இந்த நிறுவனத்தின் பெயர், மனிதக் கையின் ஏழு degrees of freedom-லிருந்து ஒரு humanoid-ன் 30 வரை, எந்தவொரு சிக்கலான இயக்கத்திற்கும் தரவை வழங்கும் அதன் இலக்கைப் பிரதிபலிக்கிறது.

முக்கியக் கருத்துக்கள்

மாதிரிகளை விட உள்கட்டமைப்பு: LLM-மையிலான ஆய்வகங்களிடம் இல்லாத பிரத்யேக தரவுப் பாதைகள் (data pipelines) மற்றும் குறிப்பு வழங்கும் கருவிகளை (annotation tools) வழங்குவதன் மூலம், XDOF "physical AI" சார்ந்த தடைகளைத் தீர்த்து வருகிறது.
உயர்தரத் தரவுத்தொகுப்புகள் (High-Fidelity Datasets): ABC dataset-ன் வெளியீடு, 130,000 கையாளுதல் பாதைகளைக் (manipulation trajectories) கொண்டு தொழில்துறைக்கு முன்னெப்போதும் இல்லாத அளவிலான தரவை வழங்குகிறது.
செயல்பாட்டு வெளிப்பணி (Operational Outsourcing): பெரிய அளவிலான இயற்பியல் தரவுத் கிடங்குகள் மற்றும் தொலைநிலை இயக்குதல் குழுக்களை (teleoperation fleets) நிர்வகிப்பதற்கான மிகப்பெரிய மூலதனம் மற்றும் தளவாடத் தேவைகளைத் தவிர்க்க frontier ஆய்வகங்களுக்கு XDOF வழிவகை செய்கிறது.

இயற்பியல் AI-இல் உள்ள முக்கியமான தரவுத் தடையைத் தீர்க்க XDOF உருவாகிறது

Physical AI-இல் உள்ள முக்கியமான தரவுத் தடையைத் தீர்க்க XDOF உருவாகிறது

தரவு இடைவெளி: ஏன் LLM-கள் ரோபோட்டிக்ஸ் சிக்கலைத் தீர்க்காது

ABC தரவுத்தொகுப்பு மற்றும் தரவு பிரமிடை உருவாக்குதல்

எல்லை ஆய்வகங்களை முந்துதல்

முக்கியக் கருத்துக்கள்

Continue reading

AI நெகிழ்வுத்தன்மை எவ்வாறு உலகளாவிய தரவு மையங்களின் மின்சாரத் தட்டுப்பாட்டைத் தீர்க்கக்கூடும்

𝗔𝗜 𝗚𝗮𝘁𝗲𝘄𝗮𝘆: 𝗧𝗵𝗲 𝗖𝗲𝗻𝘁𝗿𝗮𝗹 𝗡𝗲𝗿𝘃𝗼𝘂𝘀 𝗦𝘆𝘀𝘁𝗲𝗺 𝗳𝗼𝗿 𝗘𝗻𝘁𝗲𝗿𝗽𝗿𝗶𝘀𝗲 𝗟𝗟𝗠𝘀

AI தரவுத் தயார்நிலை இடைவெளி

AI உள்கட்டமைப்பு இடைவெளி: பணப்புழக்க நெருக்கடியை எதிர்கொள்ளும் ஹைப்பர்ஸ்கேலர்கள்

Pramaana Labs Secures $27M to Solve AI Reliability with Formal Verification