Від покеру до прибутків: як випускники DeepMind революціонізують трейдинг

Колишні дослідники DeepMind переходять від перемог над професійними гравцями в покер до управління мільярдами в обсягах ринкових операцій. Їхній празький стартап, EquiLibre Technologies, досяг приголомшливої оцінки у 500 мільйонів доларів, застосовуючи навчання з підкріпленням (reinforcement learning) у світі високих ставок кількісних фінансів.

Перенесення покерної стратегії на Волл-стріт

Основною інновацією, що рухає EquiLibre, є перехід навчання з підкріпленням (RL) від ігор з неповною інформацією до складнощів фондового ринку. Тріо засновників — CEO Martin Schmid, CTO Rudolf Kadlec та CSO Matej Moravcik — раніше здобули славу завдяки розробці DeepStack, першого ШІ, який переміг професійних гравців у безлімітний техаський холдем.

Така логіка є природною еволюцією: і покер, і трейдинг передбачають прийняття оптимальних рішень в умовах невизначеності з чіткими, вимірюваними результатами. Як зазначає Шмід, «підрахунок очок» у трейдингу надзвичайно простий — кінцевою винагородою є приріст капіталу. Використовуючи RL, де моделі навчаються через стимулюючі цикли зворотного зв'язку, EquiLibre вийшла за межі ігор, щоб здійснювати угоди на біржах S&P 500 та Nasdaq.

Масштабність та перевірена ефективність

EquiLibre не просто запускає симуляції; компанія бере активну участь у глобальних ринках. У партнерстві з кількісною фірмою Tower Research Capital алгоритми стартапу керують мільярдами доларів щоденного обсягу торгів.

Показники стартапу вирізняються особливою стабільністю. Після першого виходу на крипторинки у 2025 році компанія розширила діяльність на традиційні акції, заявляючи про «ідеальний показник — нуль від'ємних місяців з моменту заснування». Такий рівень стабільності є головним фактором привабливості для венчурних капіталістів, таких як Creandum, який нещодавно очолив раунд серії А, що став найбільшою індивідуальною інвестицією фірми на сьогодні.

Гонка за обчислювальними потужностями та талантами

Хоча EquiLibre успішно масштабувалася до оцінки у 500 мільйонів доларів, вона стикається з жорсткою конкуренцією з боку визнаних гігантів трейдингу, таких як Jane Street, які використовують десятки тисяч високопродуктивних GPU та поєднують RL із великими мовними моделями (LLM).

Щоб конкурувати, EquiLibre зосереджується на підході «спочатку лабораторія» (lab-first), а не на традиційному фінансовому мисленні. Їхня стратегія базується на двох ключових стовпах:

  • Ефективність замість грубої сили: Замість того, щоб покладатися на масивні GPU-кластери, команда прагне «отримувати більше з меншого», оптимізуючи алгоритми, щоб витиснути вищу продуктивність із обмежених обчислювальних ресурсів.
  • Стратегічна інфраструктура: Компанія планує побудувати один із найбільших обчислювальних кластерів у Центральній та Східній Європі (CEE), щоб масштабувати свої дослідницькі можливості.

Розмістивши штаб-квартиру в Празі, засновники також змогли залучити спеціалізовану чеську діаспору з таких компаній, як Google, що дозволило їм створити висококласну команду з 25 експертів поза гіперконкурентною екосистемою Сан-Франциско.

Основні висновки

  • Алгоритмічна еволюція: EquiLibre успішно переносить методи навчання з підкріпленням, що використовувалися у професійному покері (DeepStack), для управління мільярдами доларів щоденного обсягу торгів на S&P 500 та Nasdaq.
  • Стрімке зростання оцінки: Після успішного раунду серії А під керівництвом Creandum стартап досяг оцінки у 500 мільйонів доларів, що підкріплюється заявленим показником «нуль від'ємних місяців».
  • Ефективність як конкурентна перевага: Протистоячи гігантам із величезними апаратними перевагами, EquiLibre зосереджується на алгоритмічній ефективності та розбудові значної обчислювальної інфраструктури в регіоні CEE.