General Intuition arrecada US$ 320 milhões para transformar dados de videogames em IA para o mundo real

A General Intuition está apostando que os segredos da inteligência física residem nos milhões de horas de filmagens de videogames capturadas por jogadores. Ao aproveitar dados de ação de alta fidelidade provenientes dos jogos, a startup visa construir modelos de agentes que possam transitar perfeitamente de ambientes virtuais, como Fortnite, para robôs quadrúpedes físicos.

O Poder dos Rótulos de Ação sobre o Vídeo Puro

Ao contrário de muitos concorrentes que tentam treinar agentes de IA apenas observando vídeos, a General Intuition utiliza uma vantagem proprietária herdada de sua predecessora, a Medal. Enquanto a maioria dos modelos tenta inferir movimentos apenas a partir de pixels, a General Intuition aproveita "rótulos de ação" (action labels) — os comandos exatos de botões e os registros de tempo (timestamps) gravados junto com os clipes de gameplay.

Essa distinção é crítica para o desenvolvimento do raciocínio espaço-temporal. Ao saber exatamente como uma entrada humana resulta em um movimento específico em um espaço 3D, o modelo aprende causalidade: como uma ação afeta o ambiente. O CEO Pim de Witte argumenta que isso permite ao modelo distinguir o "eu" do "ambiente", um requisito fundamental para qualquer agente destinado a operar no mundo físico.

Da Simulação de Fortnite à Incorporação Robótica

A arquitetura técnica da empresa baseia-se em um "modelo de mundo" (world model) que funciona como uma academia de treinamento interna. Em vez de depender de motores de jogo tradicionais, o modelo gera ambientes quadro a quadro, permitindo que os agentes aprendam realidades baseadas na física — como a solidez das paredes ou o movimento das sombras — por meio de pura repetição.

A aplicação prática desse treinamento já é visível em suas demonstrações de hardware. A empresa implementou com sucesso o mesmo "cérebro" usado para navegar em paisagens virtuais em um grande robô quadrúpede. Surpreendentemente, a equipe relatou que foram necessários apenas oito minutos de dados de robótica do mundo real, coletados em ruas públicas, para ajustar o modelo para a navegação física do robô. Isso sugere que o trabalho pesado da inteligência está sendo feito na simulação, tornando a implementação no mundo real significativamente mais rápida e barata.

Uma Avaliação Massiva de US$ 2,3 Bilhões

A escala dessa ambição reflete-se no recente financiamento da empresa. A General Intuition arrecadou US$ 320 milhões em uma rodada liderada pela Khosla Ventures, elevando sua avaliação total para US$ 2,3 bilhões. O grupo de investidores é uma potência da realeza tecnológica, incluindo Jeff Bezos, Eric Schmidt e pesquisadores do Google DeepMind e do MIT.

O capital está destinado a dois objetivos principais:

  • Escalabilidade de Computação: Por meio de uma parceria com a CoreWeave, a empresa se concentrará no pré-treinamento da próxima geração de seu modelo.
  • Acessibilidade de API: Uma parte dos fundos será usada para lançar uma API mais ampla, permitindo potencialmente que desenvolvedores utilizem seus modelos de agentes até o final do verão.

À medida que a indústria avança para além da era intensiva em texto dos Grandes Modelos de Linguagem (LLMs), a General Intuition está se posicionando na vanguarda dos "modelos de mundo" — IAs que não apenas falam sobre o mundo, mas entendem como se mover através dele.

Principais Conclusões

  • Treinamento Baseado em Ação: Ao usar "rótulos de ação" de gameplay humano em vez de apenas vídeo, o modelo aprende causalidade e raciocínio espacial de forma muito mais eficaz do que abordagens baseadas apenas em vídeo.
  • Simulação Escalável: A startup usa videogames como uma "academia" para treinar agentes, reduzindo drasticamente a quantidade de dados caros do mundo real necessários para controlar robôs físicos.
  • Apoio Estratégico: Com uma avaliação de US$ 2,3 bilhões e o apoio de gigantes como Khosla Ventures e Jeff Bezos, a empresa está posicionada para se tornar uma camada fundamental para agentes de IA generalizados.