Dari Poker ke Keuntungan: Bagaimana Alumni DeepMind Merevolusi Perdagangan

Mantan peneliti DeepMind kini beralih dari mengalahkan pemain poker profesional menjadi mengelola volume pasar senilai miliaran dolar. Startup mereka yang berbasis di Praha, EquiLibre Technologies, telah mencapai valuasi fantastis sebesar $500 juta dengan menerapkan reinforcement learning ke dalam dunia keuangan kuantitatif yang berisiko tinggi.

Menerjemahkan Strategi Poker ke Wall Street

Inovasi inti yang mendorong EquiLibre adalah transisi reinforcement learning (RL) dari permainan informasi tidak sempurna (imperfect information games) ke kompleksitas pasar saham. Trio pendirinya—CEO Martin Schmid, CTO Rudolf Kadlec, dan CSO Matej Moravcik—sebelumnya meraih ketenaran karena mengembangkan DeepStack, AI pertama yang berhasil mengalahkan pemain profesional no-limit Texas hold ’em.

Logikanya merupakan evolusi yang alami: poker dan perdagangan sama-sama melibatkan pengambilan keputusan optimal di bawah ketidakpastian dengan hasil yang jelas dan terukur. Seperti yang dicatat Schmid, "skor" dalam perdagangan sangatlah sederhana—imbalan utamanya adalah keuntungan modal (capital gain). Dengan memanfaatkan RL, di mana model belajar melalui loop umpan balik yang terinsentif, EquiLibre telah melangkah lebih jauh dari sekadar permainan untuk mengeksekusi perdagangan di seluruh S&P 500 dan Nasdaq.

Skala Masif dan Performa yang Terbukti

EquiLibre tidak sekadar menjalankan simulasi; mereka berpartisipasi aktif di pasar global. Melalui kemitraan dengan perusahaan kuantitatif Tower Research Capital, algoritma startup ini telah mengelola volume perdagangan harian senilai miliaran dolar.

Rekam jejak startup ini sangat menonjol karena konsistensinya. Setelah peluncuran awal di pasar kripto pada tahun 2025, perusahaan ini merambah ke ekuitas tradisional, dengan klaim "rekam jejak sempurna tanpa bulan negatif sejak awal berdiri." Tingkat stabilitas ini menjadi daya tarik utama bagi pemodal ventura seperti Creandum, yang baru-baru ini memimpin putaran Seri A yang menandai investasi tunggal terbesar perusahaan tersebut hingga saat ini.

Persaingan dalam Komputasi dan Talenta

Meskipun EquiLibre telah berhasil mencapai valuasi $500 juta, mereka menghadapi persaingan sengit dari raksasa perdagangan mapan seperti Jane Street, yang menggunakan puluhan ribu GPU kelas atas dan menggabungkan RL dengan Large Language Models (LLM).

Untuk bersaing, EquiLibre berfokus pada pendekatan "lab-first" daripada pola pikir keuangan tradisional. Strategi mereka melibatkan dua pilar utama:

  • Efisiensi di atas Kekuatan Kasar (Brute Force): Alih-alih mengandalkan klaster GPU masif, tim ini bertujuan untuk "mendapatkan lebih dari yang sedikit," dengan mengoptimalkan algoritma untuk memeras performa lebih tinggi dari komputasi yang terbatas.
  • Infrastruktur Strategis: Perusahaan berencana membangun salah satu klaster komputasi terbesar di Eropa Tengah dan Timur (CEE) untuk meningkatkan kapabilitas risetnya.

Dengan berbasis di Praha, para pendiri juga memanfaatkan diaspora Ceko yang terspesialisasi dari perusahaan-perusahaan seperti Google, yang memungkinkan mereka membangun tim berkaliber tinggi yang terdiri dari 25 ahli di luar ekosistem San Francisco yang sangat kompetitif.

Poin-Poin Penting

  • Evolusi Algoritma: EquiLibre berhasil mengadaptasi teknik reinforcement learning yang digunakan dalam poker profesional (DeepStack) untuk mengelola volume harian miliaran dolar di S&P 500 dan Nasdaq.
  • Valuasi yang Meledak: Menyusul keberhasilan Seri A yang dipimpin oleh Creandum, startup ini telah mencapai valuasi $500 juta, didorong oleh laporan rekam jejak "nol bulan negatif."
  • Efisiensi sebagai Keunggulan Kompetitif (Moat): Menghadapi raksasa dengan keunggulan perangkat keras yang masif, EquiLibre berfokus pada efisiensi algoritma dan pembangunan infrastruktur komputasi yang signifikan di wilayah CEE.