XDOF émerge pour résoudre le goulot d'étranglement critique des données dans l'IA physique
Alors que la course à l'intelligence physique s'intensifie avec le relancement du programme de robotique d'OpenAI, un nouveau défi a fait surface : le manque de données d'entraînement de haute fidélité. Alors que les grands modèles de langage (LLM) ont prospéré grâce à l'immensité de l'internet public, la robotique nécessite des données d'interaction physique précises que les ensembles de données actuels ne peuvent tout simplement pas fournir.
Le fossé des données : pourquoi les LLM ne résoudront pas la robotique
Le principal obstacle au développement de robots capables n'est pas seulement la puissance de calcul ou l'architecture des modèles ; c'est l'absence d'un « fossé de données » (data moat) comparable au texte utilisé pour les modèles GPT. Les alternatives actuelles, telles que les vidéos YouTube ou les séquences de faible fidélité capturées par des travailleurs de la gig economy, sont difficiles à concilier avec les réalités physiques complexes du mouvement robotique. Ce problème de « l'œuf et de la poule » — avoir besoin de données pour entraîner les modèles, mais avoir besoin de modèles pour collecter des données efficaces — est devenu le principal goulot d'étranglement de l'industrie.
XDOF, une startup sortant de l'ombre, se positionne comme la couche d'infrastructure pour résoudre ce problème. Ayant levé 70 millions de dollars auprès de poids lourds tels que Thrive Capital, Spark Capital, a16z, Lux et WndrCo, l'entreprise construit les pipelines, les outils de collecte et les systèmes d'annotation que les laboratoires d'IA de pointe peinent à développer en interne.
Construction du jeu de données ABC et de la pyramide des données
Pour dynamiser l'écosystème, XDOF s'associe au laboratoire de recherche en IA de l'UC Berkeley pour lancer « ABC », une collection massive de données d'entraînement robotiques de haute qualité. Ce jeu de données comprend :
- 130 000 trajectoires de données de manipulation robotique.
- 300 heures de données de simulation.
- 100 heures d'évaluations.
En utilisant ces données, des équipes ont déjà réussi à entraîner des robots sur des tâches granulaires telles que plier des T-shirts, aplatir des boîtes et effectuer des opérations délicates comme placer des AirPods dans leurs boîtiers.
La stratégie de XDOF suit une « pyramide de données » à trois niveaux pour assurer un apprentissage complet. Le niveau le plus précieux concerne les données de téléopération collectées directement sur le robot cible. Viennent ensuite les données générales recueillies via des dispositifs tels que GELLO (un système de téléopération à bas coût développé par les cofondateurs de XDOF, Philippe Wu et Fred Shentu). Le dernier niveau concerne les données « égocentrées », où des humains effectuent des tâches quotidiennes tout en portant les capteurs propriétaires de XDOF afin de capturer le mouvement physique à la première personne.
Outscaling the Frontier Labs
A critical question for investors is why major AI labs aren't simply building these data factories themselves. According to CEO Philippe Wu, the operational complexity is immense. Running a data collection operation requires hundreds of thousands of square feet of warehouse space, hundreds of calibrated robots, and a massive, trained workforce of teleoperators.
By specializing in this "unglamorous" work—including data cleaning and hardware-specific calibration—XDOF allows AI labs to focus on model architecture while XDOF manages the massive logistical burden of physical data production. The company's name, a play on "degrees of freedom," reflects its goal to provide data for any arbitrary complexity of motion, from a human arm's seven degrees of freedom to a humanoid's 30.
Key Takeaways
- Infrastructure over Models: XDOF is addressing the "physical AI" bottleneck by providing the specialized data pipelines and annotation tools that LLM-centric labs lack.
- High-Fidelity Datasets: The release of the ABC dataset provides the industry with unprecedented scale, featuring 130,000 manipulation trajectories.
- Operational Outsourcing: XDOF enables frontier labs to bypass the massive capital and logistical requirements of managing large-scale physical data warehouses and teleoperation fleets.