XDOF emerge per risolvere il critico collo di bottiglia dei dati nell'IA fisica

📅2 hours ago⏱3 min read

In this article

XDOF emerge per risolvere il critico collo di bottiglia dei dati nell'AI fisica

Mentre la corsa all'intelligenza fisica si intensifica con il rilancio del programma di robotica di OpenAI, è emersa una nuova sfida: la mancanza di dati di addestramento ad alta fedeltà. Mentre i Large Language Models (LLM) hanno prosperato grazie alla vasta estensione dell'internet pubblico, la robotica richiede dati di interazione fisica precisi che gli attuali dataset semplicemente non possono fornire.

Il divario dei dati: perché gli LLM non risolveranno la robotica

L'ostacolo principale nello sviluppo di robot capaci non è solo la potenza di calcolo o l'architettura del modello; è l'assenza di un "data moat" (fossato di dati) paragonabile al testo utilizzato per i modelli GPT. Le attuali alternative, come i video di YouTube o le riprese a bassa fedeltà catturate da gig worker, sono difficili da conciliare con le complesse realtà fisiche del movimento robotico. Questo problema dell' "uovo e la gallina" — la necessità di dati per addestrare i modelli, ma la necessità di modelli per raccogliere dati efficienti — è diventato il principale collo di bottiglia per il settore.

XDOF, una startup che emerge dal regime di stealth, si sta posizionando come lo strato infrastrutturale per risolvere questo problema. Avendo raccolto 70 milioni di dollari da colossi tra cui Thrive Capital, Spark Capital, a16z, Lux e WndrCo, l'azienda sta costruendo le pipeline, gli strumenti di raccolta e i sistemi di annotazione che i laboratori di AI all'avanguardia faticano a sviluppare internamente.

Costruire il dataset ABC e la piramide dei dati

Per dare una spinta all'ecosistema, XDOF sta collaborando con il laboratorio di ricerca sull'IA dell'UC Berkeley per rilasciare "ABC", una massiccia collezione di dati di addestramento robotico di alta qualità. Questo dataset include:

130.000 traiettorie di dati di manipolazione robotica.
300 ore di dati di simulazione.
100 ore di valutazioni.

Utilizzando questi dati, i team hanno già addestrato con successo i robot in compiti granulari come piegare magliette, appiattire scatole ed eseguire operazioni delicate come inserire gli AirPods nelle loro custodie.

La strategia di XDOF segue una "piramide dei dati" a tre livelli per garantire un apprendimento completo. Il livello più prezioso riguarda i dati di teleoperazione raccolti direttamente sul robot target. A questo segue il livello dei dati generali raccolti tramite dispositivi come GELLO (un sistema di teleoperazione a basso costo sviluppato dai co-fondatori di XDOF Philippe Wu e Fred Shentu). L'ultimo livello riguarda i dati "egocentrici", in cui gli esseri umani eseguono compiti quotidiani indossando i sensori proprietari di XDOF per catturare il movimento fisico in prima persona.

Outscaling the Frontier Labs

A critical question for investors is why major AI labs aren't simply building these data factories themselves. According to CEO Philippe Wu, the operational complexity is immense. Running a data collection operation requires hundreds of thousands of square feet of warehouse space, hundreds of calibrated robots, and a massive, trained workforce of teleoperators.

By specializing in this "unglamorous" work—including data cleaning and hardware-specific calibration—XDOF allows AI labs to focus on model architecture while XDOF manages the massive logistical burden of physical data production. The company's name, a play on "degrees of freedom," reflects its goal to provide data for any arbitrary complexity of motion, from a human arm's seven degrees of freedom to a humanoid's 30.

Key Takeaways

Infrastructure over Models: XDOF is addressing the "physical AI" bottleneck by providing the specialized data pipelines and annotation tools that LLM-centric labs lack.
High-Fidelity Datasets: The release of the ABC dataset provides the industry with unprecedented scale, featuring 130,000 manipulation trajectories.
Operational Outsourcing: XDOF enables frontier labs to bypass the massive capital and logistical requirements of managing large-scale physical data warehouses and teleoperation fleets.

XDOF emerge per risolvere il critico collo di bottiglia dei dati nell'IA fisica

XDOF emerge per risolvere il critico collo di bottiglia dei dati nell'AI fisica

Il divario dei dati: perché gli LLM non risolveranno la robotica

Costruire il dataset ABC e la piramide dei dati

Outscaling the Frontier Labs

Key Takeaways

Continue reading

Come la flessibilità dell'IA potrebbe risolvere la crisi energetica globale dei data center

AI Gateway: Il sistema nervoso centrale per gli LLM aziendali

𝗧𝗵𝗲 𝗔𝗜 𝗗𝗮𝘁𝗮 𝗥𝗲𝗮𝗱𝗶𝗻𝗲𝘀𝘀 𝗚𝗮𝗽

Il divario nelle infrastrutture AI: gli hyperscaler affrontano crisi di liquidità

Pramaana Labs raccoglie 27 milioni di dollari per risolvere l'affidabilità dell'IA tramite la verifica formale