从扑克到利润:DeepMind 校友如何颠覆交易领域
前 DeepMind 研究人员正从击败职业扑克玩家转型为管理数十亿美元的市场交易量。他们总部位于布拉格的初创公司 EquiLibre Technologies 通过将强化学习应用于高风险的量化金融领域,已实现了惊人的 5 亿美元估值。
将扑克策略转化为华尔街法则
驱动 EquiLibre 的核心创新在于将强化学习 (RL) 从非完全信息博弈(imperfect information games)转向复杂的股票市场。创始三人组——CEO Martin Schmid、CTO Rudolf Kadlec 和 CSO Matej Moravcik——此前因开发了 DeepStack 而声名大噪,这是首个击败职业无限注德州扑克玩家的 AI。
其逻辑是一种自然的演进:扑克和交易都涉及在不确定性下做出最优决策,并拥有清晰、可衡量的结果。正如 Schmid 所言,交易中的“评分”极其简单——最终的奖励就是资本收益。通过利用强化学习(模型通过激励反馈循环进行学习),EquiLibre 已超越了游戏领域,开始在标普 500 指数 (S&P 500) 和纳斯达克 (Nasdaq) 进行交易。
庞大的规模与经证实的表现
EquiLibre 不仅仅是在进行模拟;它正在积极参与全球市场。通过与量化公司 Tower Research Capital 合作,该初创公司的算法一直在管理每日数十亿美元的交易量。
该初创公司的业绩记录因其稳定性而尤为引人注目。在 2025 年最初进军加密货币市场后,该公司扩展到了传统股票市场,并声称“自成立以来保持着零亏损月份的完美记录”。这种稳定水平对 Creandum 等风险投资机构具有巨大的吸引力,后者最近领投了一轮 A 轮融资,这也是该公司迄今为止规模最大的单笔投资。
算力与人才之争
虽然 EquiLibre 已成功实现 5 亿美元的估值,但它面临着来自 Jane Street 等成熟交易巨头的激烈竞争,后者利用数万个高端 GPU,并将强化学习与大语言模型 (LLMs) 相结合。
为了竞争,EquiLibre 正专注于“实验室优先”的方法,而非传统的金融思维。其战略包含两大支柱:
- 效率胜于暴力计算: 该团队的目标不是依赖庞大的 GPU 集群,而是力求“以少博多”,通过优化算法从有限的算力中榨取更高的性能。
- 战略性基础设施: 公司计划在中欧和东欧 (CEE) 地区建立最大的计算集群之一,以扩展其研究能力。
通过将总部设在布拉格,创始人还挖掘了来自 Google 等公司的专业捷克裔人才,使他们能够在竞争异常激烈的旧金山生态系统之外,建立一支由 25 名专家组成的高素质团队。
核心要点
- 算法演进: EquiLibre 成功地将用于职业扑克 (DeepStack) 的强化学习技术移植到金融领域,管理着每日数十亿美元的标普 500 和纳斯达克交易量。
- 估值爆发: 在 Creandum 领投的成功 A 轮融资后,该初创公司的估值已达到 5 亿美元,这得益于其据称“零亏损月份”的业绩记录。
- 以效率为护城河: 面对拥有巨大硬件优势的巨头,EquiLibre 正专注于算法效率,并在中东欧 (CEE) 地区建设重要的计算基础设施。
