XDOF emerge per risolvere il critico collo di bottiglia dei dati nell'AI fisica

Mentre la corsa all'intelligenza fisica si intensifica con il rilancio del programma di robotica di OpenAI, è emersa una nuova sfida: la mancanza di dati di addestramento ad alta fedeltà. Mentre i Large Language Models (LLM) hanno prosperato grazie alla vasta estensione dell'internet pubblico, la robotica richiede dati di interazione fisica precisi che gli attuali dataset semplicemente non possono fornire.

Il divario dei dati: perché gli LLM non risolveranno la robotica

L'ostacolo principale nello sviluppo di robot capaci non è solo la potenza di calcolo o l'architettura del modello; è l'assenza di un "data moat" (fossato di dati) paragonabile al testo utilizzato per i modelli GPT. Le attuali alternative, come i video di YouTube o le riprese a bassa fedeltà catturate da gig worker, sono difficili da conciliare con le complesse realtà fisiche del movimento robotico. Questo problema dell' "uovo e la gallina" — la necessità di dati per addestrare i modelli, ma la necessità di modelli per raccogliere dati efficienti — è diventato il principale collo di bottiglia per il settore.

XDOF, una startup che emerge dal regime di stealth, si sta posizionando come lo strato infrastrutturale per risolvere questo problema. Avendo raccolto 70 milioni di dollari da colossi tra cui Thrive Capital, Spark Capital, a16z, Lux e WndrCo, l'azienda sta costruendo le pipeline, gli strumenti di raccolta e i sistemi di annotazione che i laboratori di AI all'avanguardia faticano a sviluppare internamente.

Costruire il dataset ABC e la piramide dei dati

Per dare una spinta all'ecosistema, XDOF sta collaborando con il laboratorio di ricerca sull'IA dell'UC Berkeley per rilasciare "ABC", una massiccia collezione di dati di addestramento robotico di alta qualità. Questo dataset include:

Utilizzando questi dati, i team hanno già addestrato con successo i robot in compiti granulari come piegare magliette, appiattire scatole ed eseguire operazioni delicate come inserire gli AirPods nelle loro custodie.

La strategia di XDOF segue una "piramide dei dati" a tre livelli per garantire un apprendimento completo. Il livello più prezioso riguarda i dati di teleoperazione raccolti direttamente sul robot target. A questo segue il livello dei dati generali raccolti tramite dispositivi come GELLO (un sistema di teleoperazione a basso costo sviluppato dai co-fondatori di XDOF Philippe Wu e Fred Shentu). L'ultimo livello riguarda i dati "egocentrici", in cui gli esseri umani eseguono compiti quotidiani indossando i sensori proprietari di XDOF per catturare il movimento fisico in prima persona.

Outscaling the Frontier Labs

A critical question for investors is why major AI labs aren't simply building these data factories themselves. According to CEO Philippe Wu, the operational complexity is immense. Running a data collection operation requires hundreds of thousands of square feet of warehouse space, hundreds of calibrated robots, and a massive, trained workforce of teleoperators.

By specializing in this "unglamorous" work—including data cleaning and hardware-specific calibration—XDOF allows AI labs to focus on model architecture while XDOF manages the massive logistical burden of physical data production. The company's name, a play on "degrees of freedom," reflects its goal to provide data for any arbitrary complexity of motion, from a human arm's seven degrees of freedom to a humanoid's 30.

Key Takeaways