포커에서 수익으로: DeepMind 출신들이 트레이딩을 혁신하는 방법

전직 DeepMind 연구원들이 프로 포커 플레이어를 이기던 것에서 수십억 달러 규모의 시장 거래량을 관리하는 것으로 전환하고 있습니다. 프라하에 본사를 둔 이들의 스타트업 EquiLibre Technologies는 강화 학습(reinforcement learning)을 고위험 퀀트 금융 세계에 적용함으로써 5억 달러라는 놀라운 기업 가치를 달성했습니다.

포커 전략을 월스트리트로 이식하기

EquiLibre를 이끄는 핵심 혁신은 불완전 정보 게임(games of imperfect information)에서 사용되던 강화 학습(RL)을 주식 시장의 복잡성으로 전환하는 것입니다. 창립 멤버인 CEO Martin Schmid, CTO Rudolf Kadlec, CSO Matej Moravcik는 프로 노리밋 텍사스 홀덤 플레이어를 이긴 최초의 AI인 DeepStack을 개발하며 명성을 얻었습니다.

그 논리는 자연스러운 진화입니다. 포커와 트레이딩 모두 불확실성 속에서 명확하고 측정 가능한 결과를 바탕으로 최적의 결정을 내려야 한다는 공통점이 있습니다. Schmid가 언급했듯이, 트레이딩의 '점수 계산'은 놀라울 정도로 단순합니다. 궁극적인 보상은 자본 이득입니다. 모델이 인센티브가 부여된 피드백 루프를 통해 학습하는 RL을 활용함으로써, EquiLibre는 게임을 넘어 S&P 500과 Nasdaq 전반에 걸쳐 거래를 실행하고 있습니다.

거대한 규모와 입증된 성과

EquiLibre는 단순히 시뮬레이션을 실행하는 데 그치지 않고 글로벌 시장에 적극적으로 참여하고 있습니다. 퀀트 기업인 Tower Research Capital과의 파트너십을 통해, 이 스타트업의 알고리즘은 매일 수십억 달러 규모의 거래량을 관리해 왔습니다.

이 스타트업의 실적은 특히 일관성 측면에서 주목할 만합니다. 2025년 암호화폐 시장에서의 초기 출시 이후, 회사는 전통적인 주식 시장으로 영역을 확장하며 "설립 이후 마이너스 수익률을 기록한 달이 단 한 번도 없는 완벽한 기록"을 주장하고 있습니다. 이러한 안정성은 최근 Creandum이 주도한 시리즈 A 라운드(해당 기업의 역대 최대 단일 투자)와 같은 벤처 캐피털들에게 큰 매력으로 작용했습니다.

컴퓨팅 자원과 인재를 향한 경쟁

EquiLibre가 5억 달러의 기업 가치로 성공적으로 규모를 키웠지만, 수만 개의 하이엔드 GPU를 활용하고 RL을 거대 언어 모델(LLM)과 결합하는 Jane Street와 같은 기존 트레이딩 거물들과의 치열한 경쟁에 직면해 있습니다.

경쟁력을 갖추기 위해 EquiLibre는 전통적인 금융 마인드셋 대신 "연구소 우선(lab-first)" 접근 방식에 집중하고 있습니다. 이들의 전략은 두 가지 핵심 축을 포함합니다:

  • 무차별 대입(Brute Force)보다 효율성: 대규모 GPU 클러스터에 의존하는 대신, 팀은 제한된 컴퓨팅 자원에서 더 높은 성능을 끌어내기 위해 알고리즘을 최적화함으로써 "적은 것으로 더 많은 것을 얻는 것(get more from less)"을 목표로 합니다.
  • 전략적 인프라: 회사는 연구 역량을 확장하기 위해 중앙 및 동유럽(CEE)에서 가장 큰 컴퓨팅 클러스터 중 하나를 구축할 계획입니다.

프라하에 기반을 둠으로써 창립자들은 Google과 같은 기업 출신의 전문적인 체코 디아스포라(diaspora) 인력을 활용할 수 있었으며, 이를 통해 초경쟁적인 샌프란시스코 생태계를 벗어나 25명의 전문가로 구성된 고도로 숙련된 팀을 구축할 수 있었습니다.

핵심 요약

  • 알고리즘의 진화: EquiLibre는 프로 포커(DeepStack)에서 사용된 강화 학습 기술을 성공적으로 이식하여, 매일 수십억 달러 규모의 S&P 500 및 Nasdaq 거래량을 관리하고 있습니다.
  • 폭발적인 기업 가치: Creandum이 주도한 성공적인 시리즈 A 이후, 이 스타트업은 "마이너스 수익률 0개월"이라는 실적에 힘입어 5억 달러의 기업 가치에 도달했습니다.
  • 해자(Moat)로서의 효율성: 막대한 하드웨어 우위를 가진 거물들에 맞서, EquiLibre는 알고리즘 효율성에 집중하고 CEE 지역에 상당한 규모의 컴퓨팅 인프라를 구축하고 있습니다.