General Intuition sammelt 320 Mio. $ ein, um Videospiel-Daten in reale KI zu verwandeln

General Intuition setzt darauf, dass die Geheimnisse der physischen Intelligenz in den Millionen Stunden an Videospiel-Aufnahmen liegen, die von Spielern erfasst wurden. Durch die Nutzung hochpräziser Aktionsdaten aus dem Gaming strebt das Startup danach, agentische Modelle zu entwickeln, die nahtlos von virtuellen Umgebungen wie Fortnite auf physische vierbeinige Roboter übergehen können.

Die Stärke von Action Labels gegenüber reinem Videomaterial

Im Gegensatz zu vielen Wettbewerbern, die versuchen, KI-Agenten allein durch das Beobachten von Videos zu trainieren, nutzt General Intuition einen proprietären Vorteil, den das Unternehmen von seinem Vorgänger Medal übernommen hat. Während die meisten Modelle versuchen, Bewegungen allein aus Pixeln abzuleiten, nutzt General Intuition „Action Labels“ – die exakten Tastendrücke und Zeitstempel, die zusammen mit den Gameplay-Clips aufgezeichnet werden.

Diese Unterscheidung ist entscheidend für die Entwicklung räumlich-zeitlichen Denkens. Indem das Modell genau weiß, wie eine menschliche Eingabe zu einer spezifischen Bewegung in einem 3D-Raum führt, lernt es Kausalität: wie eine Aktion die Umgebung beeinflusst. CEO Pim de Witte argumentiert, dass dies dem Modell ermöglicht, das „Selbst“ von der „Umgebung“ zu unterscheiden – eine grundlegende Voraussetzung für jeden Agenten, der in der physischen Welt agieren soll.

Von der Fortnite-Simulation zur Robotik-Verkörperung

Die technische Architektur des Unternehmens basiert auf einem „World Model“, das als internes Trainings-Gym fungiert. Anstatt sich auf herkömmliche Game-Engines zu verlassen, generiert das Modell Umgebungen Frame für Frame, wodurch die Agenten physikalische Realitäten – wie die Festigkeit von Wänden oder die Bewegung von Schatten – durch reine Wiederholung erlernen können.

Die praktische Anwendung dieses Trainings ist bereits in ihren Hardware-Demos sichtbar. Das Unternehmen hat erfolgreich dasselbe „Gehirn“, das zur Navigation in virtuellen Landschaften verwendet wird, in einen großen vierbeinigen Roboter implementiert. Bemerkenswerterweise berichtete das Team, dass lediglich acht Minuten an Robotik-Daten aus der realen Welt, die auf öffentlichen Straßen gesammelt wurden, ausreichten, um das Modell für die physische Navigation des Roboters feinabzustimmen. Dies deutet darauf hin, dass die Schwerstarbeit der Intelligenzentwicklung in der Simulation stattfindet, was den Einsatz in der realen Welt erheblich schneller und kostengünstiger macht.

Eine massive Bewertung von 2,3 Milliarden US-Dollar

Das Ausmaß dieses Ehrgeizes spiegelt sich in der jüngsten Finanzierung des Unternehmens wider. General Intuition sammelte 320 Millionen US-Dollar in einer Runde ein, die von Khosla Ventures angeführt wurde, was die Gesamtbewertung auf 2,3 Milliarden US-Dollar hebt. Die Investorengruppe ist ein Kraftzentrum der Tech-Elite, darunter Jeff Bezos, Eric Schmidt sowie Forscher von Google DeepMind und dem MIT.

Das Kapital ist für zwei Hauptziele vorgesehen:

  • Skalierung der Rechenleistung: Durch eine Partnerschaft mit CoreWeave wird sich das Unternehmen auf das Pre-Training der nächsten Modellgeneration konzentrieren.
  • API-Zugänglichkeit: Ein Teil der Mittel wird für die Einführung einer breiteren API verwendet, was es Entwicklern potenziell ermöglichen könnte, bis zum Ende des Sommers auf ihre agentischen Modelle zuzugreifen.

Während sich die Branche über die textlastige Ära der Large Language Models (LLMs) hinausbewegt, positioniert sich General Intuition an der Spitze der „World Models“ – KI, die nicht nur über die Welt spricht, sondern versteht, wie man sich in ihr bewegt.

Wichtigste Erkenntnisse

  • Aktionsgesteuertes Training: Durch die Verwendung menschlicher Gameplay-„Action Labels“ anstelle von reinem Videomaterial lernt das Modell Kausalität und räumliches Denken weitaus effektiver als rein videobasierte Ansätze.
  • Skalierbare Simulation: Das Startup nutzt Videospiele als „Gym“, um Agenten zu trainieren, wodurch die Menge an teuren Echtzeitdaten, die zur Steuerung physischer Roboter benötigt werden, drastisch reduziert wird.
  • Strategische Unterstützung: Mit einer Bewertung von 2,3 Mrd. US-Dollar und der Unterstützung von Schwergewichten wie Khosla Ventures und Jeff Bezos ist das Unternehmen darauf positioniert, eine Basisschicht für generalisierte KI-Agenten zu werden.