Physical AI లోని కీలకమైన డేటా అడ్డంకిని పరిష్కరించడానికి XDOF రంగంలోకి వచ్చింది
OpenAI తన రోబోటిక్స్ ప్రోగ్రామ్ను తిరిగి ప్రారంభించడంతో, ఫిజికల్ ఇంటెలిజెన్స్ (physical intelligence) కోసం జరుగుతున్న పోటీ వేడెక్కుతోంది. అయితే, ఒక కొత్త సవాలు ఎదురైంది: అది హై-ఫిడెలిటీ (high-fidelity) శిక్షణ డేటా కొరత. Large Language Models (LLMs) పబ్లిక్ ఇంటర్నెట్లోని విస్తారమైన సమాచారంతో అభివృద్ధి చెందగా, రోబోటిక్స్కు ఖచ్చితమైన, భౌతిక పరమైన ఇంటరాక్షన్ డేటా అవసరం, దీనిని ప్రస్తుత డేటాసెట్లు అందించలేకపోతున్నాయి.
డేటా అంతరం: LLMs రోబోటిక్స్ సమస్యను ఎందుకు పరిష్కరించలేవు
సమర్థవంతమైన రోబోట్లను అభివృద్ధి చేయడంలో ప్రధాన అడ్డంకి కేవలం కంప్యూట్ లేదా మోడల్ ఆర్కిటెక్చర్ మాత్రమే కాదు; GPT మోడల్స్కు ఉపయోగించిన టెక్స్ట్తో పోలిస్తే, ఇక్కడ "డేటా మోట్" (data moat) లేకపోవడం పెద్ద సమస్య. YouTube వీడియోలు లేదా గిగ్ వర్కర్లు సేకరించిన తక్కువ నాణ్యత కలిగిన ఫుటేజీ వంటి ప్రస్తుత ప్రత్యామ్నాయాలు, రోబోటిక్ కదలికల సంక్లిష్టమైన భౌతిక వాస్తవాలతో సరిపోలడం కష్టంగా ఉంది. మోడల్లను శిక్షణ ఇవ్వడానికి డేటా కావాలి, కానీ సమర్థవంతమైన డేటాను సేకరించడానికి మోడల్లు కావాలి అనే ఈ "chicken-and-egg" సమస్య పరిశ్రమకు ప్రధాన అడ్డంకిగా మారింది.
స్టీల్త్ మోడ్లో ఉన్న స్టార్టప్ XDOF, ఈ సమస్యను పరిష్కరించడానికి ఇన్ఫ్రాస్ట్రక్చర్ లేయర్గా తనను తాను సిద్ధం చేసుకుంటోంది. Thrive Capital, Spark Capital, a16z, Lux, మరియు WndrCo వంటి దిగ్గజాల నుండి $70 మిలియన్లను సేకరించిన ఈ కంపెనీ, ఫ్రాంటియర్ AI ల్యాబ్లు సొంతంగా నిర్మించుకోవడానికి ఇబ్బంది పడుతున్న పైప్లైన్లు, సేకరణ సాధనాలు (collection tools) మరియు అనోటేషన్ సిస్టమ్లను నిర్మిస్తోంది.
ABC డేటాసెట్ మరియు డేటా పిరమిడ్ను నిర్మించడం
ఈ ఎకోసిస్టమ్ను వేగవంతం చేయడానికి, XDOF, UC Berkeley యొక్క AI రీసెర్చ్ ల్యాబ్తో కలిసి హై-క్వాలిటీ రోబోట్ శిక్షణ డేటా యొక్క భారీ సేకరణ అయిన "ABC"ని విడుదల చేస్తోంది. ఈ డేటాసెట్లో ఇవి ఉన్నాయి:
- 130,000 రోబోట్ మానిప్యులేషన్ డేటా ట్రాజెక్టరీల (trajectories).
- 300 గంటల సిమ్యులేషన్ డేటా.
- 100 గంటల మూల్యాంకనాలు (evaluations).
ఈ డేటాను ఉపయోగించి, టీమ్లు ఇప్పటికే టీ-షర్టులను మడతపెట్టడం, పెట్టెలను చదును చేయడం మరియు AirPodsలను వాటి కేస్లలో ఉంచడం వంటి సున్నితమైన పనులపై రోబోట్లకు విజయవంతంగా శిక్షణ ఇచ్చారు.
సమగ్రమైన అభ్యాసాన్ని (comprehensive learning) నిర్ధారించడానికి XDOF వ్యూహం మూడు స్థాయిల "డేటా పిరమిడ్"ను అనుసరిస్తుంది. అత్యంత విలువైన స్థాయి నేరుగా టార్గెట్ రోబోట్పై సేకరించిన టెలిఆపరేషన్ (teleoperation) డేటాను కలిగి ఉంటుంది. దీని తర్వాత GELLO (XDOF సహ వ్యవస్థాపకులు Philippe Wu మరియు Fred Shentu అభివృద్ధి చేసిన తక్కువ ఖర్చుతో కూడిన టెలిఆపరేషన్ సిస్టమ్) వంటి పరికరాల ద్వారా సేకరించిన సాధారణ డేటా వస్తుంది. చివరి స్థాయి "ఎగోసెంట్రిక్" (egocentric) డేటాను కలిగి ఉంటుంది, ఇక్కడ మనుషులు XDOF యొక్క ప్రొప్రైటరీ సెన్సార్లను ధరించి రోజువారీ పనులను చేస్తారు, తద్వారా ఫస్ట్-పర్సన్ భౌతిక కదలికలను క్యాప్చర్ చేయవచ్చు.
ఫ్రంటియర్ ల్యాబ్లను అధిగమించడం
పెట్టుబడిదారులకు ఒక కీలకమైన ప్రశ్న ఏమిటంటే, ప్రధాన AI ల్యాబ్లు ఈ డేటా ఫ్యాక్టరీలను తామే ఎందుకు నిర్మించుకోవడం లేదు? CEO ఫిలిప్ వు (Philippe Wu) ప్రకారం, దీని నిర్వహణ సంక్లిష్టత అపారమైనది. డేటా సేకరణ కార్యకలాపాలను నిర్వహించడానికి లక్షలాది చదరపు అడుగుల గిడ్డంగి స్థలం, వందలాది కాలిబ్రేటెడ్ రోబోలు మరియు టెలిఆపరేటర్ల భారీ, శిక్షణ పొందిన శ్రామిక శక్తి అవసరం.
డేటా క్లీనింగ్ మరియు హార్డ్వేర్-నిర్దిష్ట కాలిబ్రేషన్ వంటి ఈ "ఆకర్షణీయంగా లేని" పనులలో ప్రత్యేకత సాధించడం ద్వారా, XDOF AI ల్యాబ్లు మోడల్ ఆర్కిటెక్చర్పై దృష్టి సారించడానికి వీలు కల్పిస్తుంది, అదే సమయంలో భౌతిక డేటా ఉత్పత్తి యొక్క భారీ లాజిస్టికల్ భారాన్ని XDOF నిర్వహిస్తుంది. కంపెనీ పేరు "degrees of freedom" అనే పదంపై ఆధారపడి ఉంది, ఇది మానవ చేయి యొక్క ఏడు డిగ్రీస్ ఆఫ్ ఫ్రీడమ్ నుండి హ్యూమనాయిడ్ యొక్క 30 డిగ్రీల వరకు, ఏవైనా సంక్లిష్టమైన కదలికల కోసం డేటాను అందించాలనే దాని లక్ష్యాన్ని ప్రతిబింబిస్తుంది.
ముఖ్య అంశాలు
- మోడల్స్ కంటే ఇన్ఫ్రాస్ట్రక్చర్కు ప్రాధాన్యత: LLM-కేంద్రీకృత ల్యాబ్లకు లేని ప్రత్యేక డేటా పైప్లైన్లు మరియు అనోటేషన్ టూల్స్ను అందించడం ద్వారా XDOF "ఫిజికల్ AI" అడ్డంకిని పరిష్కరిస్తోంది.
- హై-ఫిడెలిటీ డేటాసెట్లు: ABC డేటాసెట్ విడుదల పరిశ్రమకు 1,30,000 మానిప్యులేషన్ ట్రాజెక్టరీలతో అపూర్వమైన స్థాయిని అందిస్తుంది.
- ఆపరేషనల్ అవుట్సోర్సింగ్: భారీ స్థాయి భౌతిక డేటా గిడ్డంగిలు మరియు టెలిఆపరేషన్ ఫ్లీట్లను నిర్వహించడానికి అవసరమైన భారీ మూలధనం మరియు లాజిస్టికల్ అవసరాలను అధిగమించడానికి XDOF ఫ్రంటియర్ ల్యాబ్లకు సహాయపడుతుంది.