Del póker a los beneficios: cómo los exalumnos de DeepMind están revolucionando el trading
Antiguos investigadores de DeepMind están pasando de derrotar a jugadores profesionales de póker a gestionar miles de millones en volumen de mercado. Su startup con sede en Praga, EquiLibre Technologies, ha alcanzado una asombrosa valoración de 500 millones de dólares aplicando el aprendizaje por refuerzo al mundo de alto riesgo de las finanzas cuantitativas.
Traduciendo la estrategia del póker a Wall Street
La innovación principal que impulsa a EquiLibre es la transición del aprendizaje por refuerzo (RL) desde los juegos de información imperfecta hacia las complejidades del mercado de valores. El trío fundador —el CEO Martin Schmid, el CTO Rudolf Kadlec y el CSO Matej Moravcik— ganó fama anteriormente por desarrollar DeepStack, la primera IA en derrotar a jugadores profesionales de Texas hold ’em sin límite.
La lógica es una evolución natural: tanto el póker como el trading implican tomar decisiones óptimas bajo incertidumbre con resultados claros y medibles. Como señala Schmid, la "puntuación" en el trading es notablemente sencilla: la recompensa final es la ganancia de capital. Al utilizar RL, donde los modelos aprenden a través de bucles de retroalimentación incentivados, EquiLibre ha ido más allá de los juegos para ejecutar operaciones en el S&P 500 y el Nasdaq.
Escala masiva y rendimiento probado
EquiLibre no se limita a ejecutar simulaciones; participa activamente en los mercados globales. En asociación con la firma cuantitativa Tower Research Capital, los algoritmos de la startup han estado gestionando miles de millones de dólares en volumen de negociación diario.
La trayectoria de la startup es particularmente notable por su consistencia. Tras un despliegue inicial en los mercados de criptomonedas en 2025, la empresa se expandió hacia la renta variable tradicional, alegando un "récord perfecto de cero meses negativos desde su creación". Este nivel de estabilidad es un gran atractivo para los capitalistas de riesgo como Creandum, que recientemente lideró una ronda de Serie A que supuso la mayor inversión individual de la firma hasta la fecha.
La carrera por la capacidad de cómputo y el talento
Aunque EquiLibre ha logrado escalar hasta una valoración de 500 millones de dólares, se enfrenta a una intensa competencia de gigantes del trading ya establecidos, como Jane Street, que utiliza decenas de miles de GPUs de alta gama y combina RL con modelos de lenguaje de gran tamaño (LLMs).
Para competir, EquiLibre se está centrando en un enfoque de "primero el laboratorio" en lugar de una mentalidad financiera tradicional. Su estrategia se basa en dos pilares clave:
- Eficiencia sobre fuerza bruta: En lugar de depender de clústeres masivos de GPUs, el equipo aspira a "obtener más con menos", optimizando los algoritmos para exprimir un mayor rendimiento de una capacidad de cómputo limitada.
- Infraestructura estratégica: La empresa planea construir uno de los clústeres de cómputo más grandes de Europa Central y Oriental (CEE) para escalar sus capacidades de investigación.
Al establecerse en Praga, los fundadores también han aprovechado una diáspora checa especializada procedente de empresas como Google, lo que les permite construir un equipo de 25 expertos de alto calibre fuera del ecosistema hipercompetitivo de San Francisco.
Conclusiones clave
- Evolución algorítmica: EquiLibre está trasladando con éxito las técnicas de aprendizaje por refuerzo utilizadas en el póker profesional (DeepStack) para gestionar miles de millones en volumen diario del S&P 500 y el Nasdaq.
- Valoración explosiva: Tras una exitosa Serie A liderada por Creandum, la startup ha alcanzado una valoración de 500 millones de dólares, impulsada por un historial reportado de "cero meses negativos".
- La eficiencia como ventaja competitiva: Al enfrentarse a gigantes con ventajas de hardware masivas, EquiLibre se centra en la eficiencia algorítmica y en la construcción de una infraestructura de cómputo significativa en la región de Europa Central y Oriental (CEE).
