XDOF surge para resolver el cuello de botella crítico de datos en la IA física
A medida que la carrera por la inteligencia física se intensifica con el relanzamiento del programa de robótica de OpenAI, ha surgido un nuevo desafío: la falta de datos de entrenamiento de alta fidelidad. Mientras que los grandes modelos de lenguaje (LLM) prosperaron gracias a la vasta extensión de la internet pública, la robótica requiere datos de interacción física precisos que los conjuntos de datos actuales simplemente no pueden proporcionar.
La brecha de datos: por qué los LLM no resolverán la robótica
El principal obstáculo para desarrollar robots capaces no es solo la capacidad de cómputo o la arquitectura del modelo; es la ausencia de un "foso de datos" (data moat) comparable al texto utilizado para los modelos GPT. Las alternativas actuales, como los videos de YouTube o las grabaciones de baja fidelidad capturadas por trabajadores de la economía gig, son difíciles de conciliar con las complejas realidades físicas del movimiento robótico. Este problema del "huevo y la gallina" —necesitar datos para entrenar modelos, pero necesitar modelos para recopilar datos eficientes— se ha convertido en el principal cuello de botella para la industria.
XDOF, una startup que emerge del anonimato, se está posicionando como la capa de infraestructura para resolver esto. Tras haber recaudado 70 millones de dólares de pesos pesados como Thrive Capital, Spark Capital, a16z, Lux y WndrCo, la empresa está construyendo los pipelines, las herramientas de recolección y los sistemas de anotación que los laboratorios de IA de vanguardia están luchando por construir internamente.
Construyendo el conjunto de datos ABC y la pirámide de datos
Para impulsar el ecosistema, XDOF se ha asociado con el laboratorio de investigación de IA de la UC Berkeley para lanzar "ABC", una colección masiva de datos de entrenamiento robótico de alta calidad. Este conjunto de datos incluye:
- 130.000 trayectorias de datos de manipulación robótica.
- 300 horas de datos de simulación.
- 100 horas de evaluaciones.
Utilizando estos datos, los equipos ya han entrenado con éxito a robots en tareas granulares como doblar camisetas, aplanar cajas y realizar operaciones delicadas como colocar AirPods en sus estuches.
La estrategia de XDOF sigue una "pirámide de datos" de tres niveles para garantizar un aprendizaje integral. El nivel más valioso consiste en datos de teleoperación recopilados directamente en el robot objetivo. A este le siguen los datos generales recopilados a través de dispositivos como GELLO (un sistema de teleoperación de bajo costo desarrollado por los cofundadores de XDOF, Philippe Wu y Fred Shentu). El nivel final involucra datos "egocéntricos", donde los humanos realizan tareas cotidianas mientras usan los sensores patentados de XDOF para capturar el movimiento físico en primera persona.
Superando la escala de los laboratorios de vanguardia
Una pregunta crítica para los inversores es por qué los principales laboratorios de IA no están construyendo estas fábricas de datos por sí mismos. Según el CEO Philippe Wu, la complejidad operativa es inmensa. Gestionar una operación de recolección de datos requiere cientos de miles de pies cuadrados de espacio de almacén, cientos de robots calibrados y una enorme fuerza laboral capacitada de teleoperadores.
Al especializarse en este trabajo "poco glamuroso" —que incluye la limpieza de datos y la calibración específica de hardware— XDOF permite que los laboratorios de IA se concentren en la arquitectura de los modelos, mientras XDOF gestiona la enorme carga logística de la producción de datos físicos. El nombre de la empresa, un juego de palabras con "grados de libertad", refleja su objetivo de proporcionar datos para cualquier complejidad de movimiento arbitraria, desde los siete grados de libertad de un brazo humano hasta los 30 de un humanoide.
Puntos clave
- Infraestructura sobre modelos: XDOF está abordando el cuello de botella de la "IA física" al proporcionar los canales de datos especializados y las herramientas de anotación de los que carecen los laboratorios centrados en LLM.
- Conjuntos de datos de alta fidelidad: El lanzamiento del ABC dataset proporciona a la industria una escala sin precedentes, con 130,000 trayectorias de manipulación.
- Externalización operativa: XDOF permite a los laboratorios de vanguardia eludir los enormes requisitos de capital y logística que supone la gestión de almacenes de datos físicos y flotas de teleoperación a gran escala.