Cómo General Intuition utiliza los videojuegos para construir IA para el mundo real
General Intuition está intentando un cambio de paradigma masivo en la robótica mediante el uso de conjuntos de datos masivos de videojuegos para entrenar modelos agénticos para el mundo físico. Con una nueva ronda de financiación de 320 millones de dólares, la startup apuesta a que los "datos de acción" que se encuentran en los juegos son el eslabón perdido para la inteligencia artificial.
El poder de las etiquetas de acción y el razonamiento espacio-temporal
Mientras que muchos investigadores de IA intentan entrenar modelos simplemente observando metraje de video, el CEO de General Intuition, Pim de Witte, sostiene que el video por sí solo es insuficiente. La ventaja competitiva de la empresa reside en su acceso a datos patentados de Medal, una plataforma donde los usuarios comparten clips de videojuegos.
A diferencia del video estándar, estos clips contienen "etiquetas de acción" integradas: registros precisos de qué botones presionó un jugador y exactamente cuándo. Esto permite que el modelo vaya más allá del mero reconocimiento de patrones; aprende razonamiento espacio-temporal. Al comprender el vínculo directo entre una entrada específica (una acción) y el cambio resultante en el entorno (la reacción), la IA comienza a comprender la causalidad. Esto permite al modelo distinguir el "yo" del "entorno", un requisito fundamental para cualquier agente autónomo.
De Fortnite a robots cuadrúpedos
La ambición técnica de la empresa es crear un único modelo que se generalice en diferentes dominios: jugabilidad, simulación y encarnación física. En demostraciones recientes, un agente de IA entrenado en jugabilidad fue capaz de navegar por entornos virtuales complejos, comprendiendo que las paredes son objetos sólidos y que las sombras cambian con el movimiento del sol.
Crucialmente, este "cerebro" se está trasladando directamente al hardware. La empresa demostró un robot cuadrúpedo que utilizaba el mismo modelo que impulsa a sus agentes de juego. Cabe destacar que el equipo informó que solo se necesitaron ocho minutos de datos de robótica del mundo real —recopilados en calles reales— para ajustar el modelo para la navegación del robot. Esto sugiere que el trabajo pesado de aprender física y conciencia espacial se está realizando en el "gimnasio" de los videojuegos, haciendo que el despliegue en el mundo real sea significativamente más eficiente.
Una apuesta de 2.300 millones de dólares por los agentes generales
La escala de esta ambición se refleja en la valoración de la empresa. General Intuition recaudó recientemente 320 millones de dólares con una valoración de 2.300 millones de dólares, lo que eleva su financiación total divulgada a 454 millones de dólares. La ronda fue liderada por Khosla Ventures, con una participación significativa de General Catalyst, Jeff Bezos, Eric Schmidt e investigadores de Google DeepMind y el MIT.
El capital está destinado a dos objetivos principales: escalar la capacidad de cómputo mediante una asociación con CoreWeave y hacer que su API esté disponible de forma más amplia para finales del verano. Para inversores como Vinod Khosla, el objetivo no es solo una mejor automatización, sino el surgimiento de la "intuición de la IA": una capacidad similar a la humana para navegar por el mundo a través de la comprensión, en lugar de simplemente seguir instrucciones programadas.
Conclusiones clave
- Entrenamiento impulsado por la acción: General Intuition utiliza "etiquetas de acción" de pulsación de botones de clips de juegos para enseñar causalidad a la IA, superando las limitaciones del entrenamiento basado únicamente en video.
- Simulación escalable: Al utilizar los videojuegos como un "gimnasio", la empresa puede entrenar un razonamiento espacio-temporal complejo sin el gasto masivo que supone recopilar datos robóticos del mundo real.
- Respaldo institucional masivo: Con una valoración de 2.300 millones de dólares y el apoyo de figuras como Jeff Bezos y Eric Schmidt, la empresa se está posicionando como un actor fundamental en la era de los modelos de mundo.
