ఫిజికల్ AIలో కీలకమైన డేటా అడ్డంకిని పరిష్కరించడానికి XDOF రంగంలోకి వచ్చింది

📅2 hours ago⏱3 min read

In this article

Physical AI లోని కీలకమైన డేటా అడ్డంకిని పరిష్కరించడానికి XDOF రంగంలోకి వచ్చింది

OpenAI తన రోబోటిక్స్ ప్రోగ్రామ్‌ను తిరిగి ప్రారంభించడంతో, ఫిజికల్ ఇంటెలిజెన్స్ (physical intelligence) కోసం జరుగుతున్న పోటీ వేడెక్కుతోంది. అయితే, ఒక కొత్త సవాలు ఎదురైంది: అది హై-ఫిడెలిటీ (high-fidelity) శిక్షణ డేటా కొరత. Large Language Models (LLMs) పబ్లిక్ ఇంటర్నెట్‌లోని విస్తారమైన సమాచారంతో అభివృద్ధి చెందగా, రోబోటిక్స్‌కు ఖచ్చితమైన, భౌతిక పరమైన ఇంటరాక్షన్ డేటా అవసరం, దీనిని ప్రస్తుత డేటాసెట్‌లు అందించలేకపోతున్నాయి.

డేటా అంతరం: LLMs రోబోటిక్స్ సమస్యను ఎందుకు పరిష్కరించలేవు

సమర్థవంతమైన రోబోట్‌లను అభివృద్ధి చేయడంలో ప్రధాన అడ్డంకి కేవలం కంప్యూట్ లేదా మోడల్ ఆర్కిటెక్చర్ మాత్రమే కాదు; GPT మోడల్స్‌కు ఉపయోగించిన టెక్స్ట్‌తో పోలిస్తే, ఇక్కడ "డేటా మోట్" (data moat) లేకపోవడం పెద్ద సమస్య. YouTube వీడియోలు లేదా గిగ్ వర్కర్లు సేకరించిన తక్కువ నాణ్యత కలిగిన ఫుటేజీ వంటి ప్రస్తుత ప్రత్యామ్నాయాలు, రోబోటిక్ కదలికల సంక్లిష్టమైన భౌతిక వాస్తవాలతో సరిపోలడం కష్టంగా ఉంది. మోడల్‌లను శిక్షణ ఇవ్వడానికి డేటా కావాలి, కానీ సమర్థవంతమైన డేటాను సేకరించడానికి మోడల్‌లు కావాలి అనే ఈ "chicken-and-egg" సమస్య పరిశ్రమకు ప్రధాన అడ్డంకిగా మారింది.

స్టీల్త్ మోడ్‌లో ఉన్న స్టార్టప్ XDOF, ఈ సమస్యను పరిష్కరించడానికి ఇన్‌ఫ్రాస్ట్రక్చర్ లేయర్‌గా తనను తాను సిద్ధం చేసుకుంటోంది. Thrive Capital, Spark Capital, a16z, Lux, మరియు WndrCo వంటి దిగ్గజాల నుండి $70 మిలియన్లను సేకరించిన ఈ కంపెనీ, ఫ్రాంటియర్ AI ల్యాబ్‌లు సొంతంగా నిర్మించుకోవడానికి ఇబ్బంది పడుతున్న పైప్‌లైన్‌లు, సేకరణ సాధనాలు (collection tools) మరియు అనోటేషన్ సిస్టమ్‌లను నిర్మిస్తోంది.

ABC డేటాసెట్ మరియు డేటా పిరమిడ్‌ను నిర్మించడం

ఈ ఎకోసిస్టమ్‌ను వేగవంతం చేయడానికి, XDOF, UC Berkeley యొక్క AI రీసెర్చ్ ల్యాబ్‌తో కలిసి హై-క్వాలిటీ రోబోట్ శిక్షణ డేటా యొక్క భారీ సేకరణ అయిన "ABC"ని విడుదల చేస్తోంది. ఈ డేటాసెట్‌లో ఇవి ఉన్నాయి:

130,000 రోబోట్ మానిప్యులేషన్ డేటా ట్రాజెక్టరీల (trajectories).
300 గంటల సిమ్యులేషన్ డేటా.
100 గంటల మూల్యాంకనాలు (evaluations).

ఈ డేటాను ఉపయోగించి, టీమ్‌లు ఇప్పటికే టీ-షర్టులను మడతపెట్టడం, పెట్టెలను చదును చేయడం మరియు AirPodsలను వాటి కేస్‌లలో ఉంచడం వంటి సున్నితమైన పనులపై రోబోట్‌లకు విజయవంతంగా శిక్షణ ఇచ్చారు.

సమగ్రమైన అభ్యాసాన్ని (comprehensive learning) నిర్ధారించడానికి XDOF వ్యూహం మూడు స్థాయిల "డేటా పిరమిడ్"ను అనుసరిస్తుంది. అత్యంత విలువైన స్థాయి నేరుగా టార్గెట్ రోబోట్‌పై సేకరించిన టెలిఆపరేషన్ (teleoperation) డేటాను కలిగి ఉంటుంది. దీని తర్వాత GELLO (XDOF సహ వ్యవస్థాపకులు Philippe Wu మరియు Fred Shentu అభివృద్ధి చేసిన తక్కువ ఖర్చుతో కూడిన టెలిఆపరేషన్ సిస్టమ్) వంటి పరికరాల ద్వారా సేకరించిన సాధారణ డేటా వస్తుంది. చివరి స్థాయి "ఎగోసెంట్రిక్" (egocentric) డేటాను కలిగి ఉంటుంది, ఇక్కడ మనుషులు XDOF యొక్క ప్రొప్రైటరీ సెన్సార్లను ధరించి రోజువారీ పనులను చేస్తారు, తద్వారా ఫస్ట్-పర్సన్ భౌతిక కదలికలను క్యాప్చర్ చేయవచ్చు.

ఫ్రంటియర్ ల్యాబ్‌లను అధిగమించడం

పెట్టుబడిదారులకు ఒక కీలకమైన ప్రశ్న ఏమిటంటే, ప్రధాన AI ల్యాబ్‌లు ఈ డేటా ఫ్యాక్టరీలను తామే ఎందుకు నిర్మించుకోవడం లేదు? CEO ఫిలిప్ వు (Philippe Wu) ప్రకారం, దీని నిర్వహణ సంక్లిష్టత అపారమైనది. డేటా సేకరణ కార్యకలాపాలను నిర్వహించడానికి లక్షలాది చదరపు అడుగుల గిడ్డంగి స్థలం, వందలాది కాలిబ్రేటెడ్ రోబోలు మరియు టెలిఆపరేటర్ల భారీ, శిక్షణ పొందిన శ్రామిక శక్తి అవసరం.

డేటా క్లీనింగ్ మరియు హార్డ్‌వేర్-నిర్దిష్ట కాలిబ్రేషన్ వంటి ఈ "ఆకర్షణీయంగా లేని" పనులలో ప్రత్యేకత సాధించడం ద్వారా, XDOF AI ల్యాబ్‌లు మోడల్ ఆర్కిటెక్చర్‌పై దృష్టి సారించడానికి వీలు కల్పిస్తుంది, అదే సమయంలో భౌతిక డేటా ఉత్పత్తి యొక్క భారీ లాజిస్టికల్ భారాన్ని XDOF నిర్వహిస్తుంది. కంపెనీ పేరు "degrees of freedom" అనే పదంపై ఆధారపడి ఉంది, ఇది మానవ చేయి యొక్క ఏడు డిగ్రీస్ ఆఫ్ ఫ్రీడమ్ నుండి హ్యూమనాయిడ్ యొక్క 30 డిగ్రీల వరకు, ఏవైనా సంక్లిష్టమైన కదలికల కోసం డేటాను అందించాలనే దాని లక్ష్యాన్ని ప్రతిబింబిస్తుంది.

ముఖ్య అంశాలు

మోడల్స్ కంటే ఇన్‌ఫ్రాస్ట్రక్చర్‌కు ప్రాధాన్యత: LLM-కేంద్రీకృత ల్యాబ్‌లకు లేని ప్రత్యేక డేటా పైప్‌లైన్‌లు మరియు అనోటేషన్ టూల్స్‌ను అందించడం ద్వారా XDOF "ఫిజికల్ AI" అడ్డంకిని పరిష్కరిస్తోంది.
హై-ఫిడెలిటీ డేటాసెట్‌లు: ABC డేటాసెట్ విడుదల పరిశ్రమకు 1,30,000 మానిప్యులేషన్ ట్రాజెక్టరీలతో అపూర్వమైన స్థాయిని అందిస్తుంది.
ఆపరేషనల్ అవుట్‌సోర్సింగ్: భారీ స్థాయి భౌతిక డేటా గిడ్డంగిలు మరియు టెలిఆపరేషన్ ఫ్లీట్‌లను నిర్వహించడానికి అవసరమైన భారీ మూలధనం మరియు లాజిస్టికల్ అవసరాలను అధిగమించడానికి XDOF ఫ్రంటియర్ ల్యాబ్‌లకు సహాయపడుతుంది.

ఫిజికల్ AIలో కీలకమైన డేటా అడ్డంకిని పరిష్కరించడానికి XDOF రంగంలోకి వచ్చింది

Physical AI లోని కీలకమైన డేటా అడ్డంకిని పరిష్కరించడానికి XDOF రంగంలోకి వచ్చింది

డేటా అంతరం: LLMs రోబోటిక్స్ సమస్యను ఎందుకు పరిష్కరించలేవు

ABC డేటాసెట్ మరియు డేటా పిరమిడ్‌ను నిర్మించడం

ఫ్రంటియర్ ల్యాబ్‌లను అధిగమించడం

ముఖ్య అంశాలు

Continue reading

How AI Flexibility Could Solve the Global Data Center Power Crunch

AI గేట్‌వే: ఎంటర్‌ప్రైజ్ LLMల కోసం కేంద్ర నరాల వ్యవస్థ

𝗧𝗵𝗲 𝗔𝗜 𝗗𝗮𝘁𝗮 𝗥𝗲𝗮𝗱𝗶𝗻𝗲𝘀𝘀 𝗚𝗮𝗽

AI మౌలిక సదుపాయాల అంతరం: నగదు ప్రవాహ సంక్షోభాలను ఎదుర్కొంటున్న హైపర్‌స్కేలర్లు

AI విశ్వసనీయతను ఫార్మల్ వెరిఫికేషన్ ద్వారా పరిష్కరించడానికి Pramaana Labs $27 మిలియన్లను సేకరించింది