Vom Poker zu Profiten: Wie DeepMind-Alumni den Handel revolutionieren
Ehemalige DeepMind-Forscher wandeln sich: Statt professionelle Pokerspieler zu besiegen, verwalten sie nun Handelsvolumina in Milliardenhöhe. Ihr in Prag ansässiges Startup, EquiLibre Technologies, hat durch die Anwendung von Reinforcement Learning auf die hochriskante Welt der quantitativen Finanzwirtschaft eine beeindruckende Bewertung von 500 Millionen US-Dollar erreicht.
Poker-Strategien auf die Wall Street übertragen
Die zentrale Innovation hinter EquiLibre ist der Transfer von Reinforcement Learning (RL) von Spielen mit unvollständiger Information auf die Komplexität des Aktienmarktes. Das Gründer-Trio – CEO Martin Schmid, CTO Rudolf Kadlec und CSO Matej Moravcik – erlangte zuvor durch die Entwicklung von DeepStack Berühmtheit, der ersten KI, die professionelle No-Limit Texas Hold ’em-Spieler besiegte.
Die Logik dahinter ist eine natürliche Evolution: Sowohl beim Poker als auch beim Trading geht es darum, unter Unsicherheit optimale Entscheidungen mit klaren, messbaren Ergebnissen zu treffen. Wie Schmid anmerkt, ist das „Scoring“ beim Trading bemerkenswert einfach – die ultimative Belohnung ist der Kapitalzuwachs. Durch den Einsatz von RL, bei dem Modelle durch anreizgesteuerte Feedbackschleifen lernen, ist EquiLibre über das Gaming hinausgewachsen und führt nun Trades im S&P 500 und Nasdaq aus.
Massives Ausmaß und bewährte Performance
EquiLibre führt nicht bloß Simulationen durch; das Unternehmen nimmt aktiv an den globalen Märkten teil. In Partnerschaft mit der quantitativen Investmentfirma Tower Research Capital verwalten die Algorithmen des Startups täglich Handelsvolumina in Milliardenhöhe.
Die Erfolgsbilanz des Startups ist besonders für ihre Beständigkeit bemerkenswert. Nach einem ersten Rollout in den Kryptomärkten im Jahr 2025 expandierte das Unternehmen in den Bereich der traditionellen Aktien und gibt an, eine „perfekte Bilanz von null negativen Monaten seit der Gründung“ vorzuweisen. Diese Stabilität ist ein Hauptargument für Risikokapitalgeber wie Creandum, das kürzlich eine Series-A-Runde anführte, die die bisher größte Einzelinvestition des Unternehmens darstellte.
Das Rennen um Rechenleistung und Talente
Obwohl EquiLibre erfolgreich eine Bewertung von 500 Millionen US-Dollar erreicht hat, steht das Unternehmen in intensivem Wettbewerb mit etablierten Handelsriesen wie Jane Street, die zehntausende High-End-GPUs einsetzen und RL mit Large Language Models (LLMs) kombinieren.
Um wettbewerbsfähig zu bleiben, setzt EquiLibre auf einen „Lab-First“-Ansatz anstelle einer traditionellen Finanzmentalität. Ihre Strategie basiert auf zwei Kernsäulen:
- Effizienz statt Brute Force: Anstatt sich auf massive GPU-Cluster zu verlassen, zielt das Team darauf ab, „mehr aus weniger zu machen“, indem Algorithmen optimiert werden, um eine höhere Leistung aus begrenzter Rechenkapazität herauszuholen.
- Strategische Infrastruktur: Das Unternehmen plant den Aufbau eines der größten Rechencluster in Mittel- und Osteuropa (CEE), um seine Forschungskapazitäten zu skalieren.
Durch den Standort Prag konnten die Gründer zudem auf eine spezialisierte tschechische Diaspora aus Unternehmen wie Google zurückgreifen, was es ihnen ermöglicht, ein hochkarätiges Team aus 25 Experten außerhalb des hyperkompetitiven San-Francisco-Ökosystems aufzubauen.
Die wichtigsten Erkenntnisse
- Algorithmische Evolution: EquiLibre überträgt erfolgreich Reinforcement-Learning-Techniken aus dem professionellen Poker (DeepStack), um tägliche Handelsvolumina in Milliardenhöhe im S&P 500 und Nasdaq zu verwalten.
- Explosive Bewertung: Nach einer erfolgreichen Series-A-Runde unter der Führung von Creandum hat das Startup eine Bewertung von 500 Millionen US-Dollar erreicht, gestützt durch eine berichtete Bilanz von „null negativen Monaten“.
- Effizienz als Wettbewerbsvorteil: Angesichts von Giganten mit massiven Hardware-Vorteilen konzentriert sich EquiLibre auf algorithmische Effizienz und den Aufbau einer bedeutenden Recheninfrastruktur in der CEE-Region.
