Dari Poker ke Keuntungan: Bagaimana Alumni DeepMind Merevolusikan Perdagangan

Bekas penyelidik DeepMind kini beralih daripada menewaskan pemain poker profesional kepada menguruskan volum pasaran bernilai berbilion-bilion. Syarikat pemula mereka yang berpangkalan di Prague, EquiLibre Technologies, telah mencapai penilaian luar biasa sebanyak $500 juta dengan menerapkan pembelajaran pengukuhan (reinforcement learning) ke dalam dunia kewangan kuantitatif yang berisiko tinggi.

Menterjemah Strategi Poker ke Wall Street

Inovasi teras yang memacu EquiLibre adalah peralihan pembelajaran pengukuhan (RL) daripada permainan maklumat tidak sempurna kepada kerumitan pasaran saham. Tiga pengasasnya—CEO Martin Schmid, CTO Rudolf Kadlec, dan CSO Matej Moravcik—sebelum ini terkenal kerana membangunkan DeepStack, AI pertama yang menewaskan pemain profesional Texas hold ’em tanpa had (no-limit).

Logiknya adalah satu evolusi semula jadi: kedua-dua poker dan perdagangan melibatkan pembuatan keputusan yang optimum di bawah ketidakpastian dengan hasil yang jelas dan boleh diukur. Seperti yang dinyatakan oleh Schmid, "pemarkahan" dalam perdagangan adalah sangat mudah—ganjaran utamanya ialah keuntungan modal. Dengan menggunakan RL, di mana model belajar melalui gelung maklum balas yang diberi insentif, EquiLibre telah melangkaui dunia permainan untuk melaksanakan perdagangan merentasi S&P 500 dan Nasdaq.

Skala Besar dan Prestasi Terbukti

EquiLibre bukan sekadar menjalankan simulasi; ia sedang mengambil bahagian secara aktif dalam pasaran global. Melalui kerjasama dengan firma kuantitatif Tower Research Capital, algoritma syarikat pemula ini telah menguruskan berbilion-bilion dolar dalam volum perdagangan harian.

Rekod prestasi syarikat pemula ini sangat menonjol kerana konsistensinya. Selepas pelancaran awal dalam pasaran kripto pada tahun 2025, syarikat tersebut berkembang ke dalam ekuiti tradisional, dengan mendakwa "rekod sempurna tanpa bulan negatif sejak penubuhan." Tahap kestabilan ini merupakan daya tarikan utama bagi pemodal teroka seperti Creandum, yang baru-baru ini menerajui pusingan Siri A yang menandakan pelaburan tunggal terbesar firma tersebut setakat ini.

Perlumbaan untuk Kuasa Komputasi dan Bakat

Walaupun EquiLibre telah berjaya mencapai penilaian $500 juta, ia menghadapi persaingan sengit daripada gergasi perdagangan sedia ada seperti Jane Street, yang menggunakan puluhan ribu GPU berprestasi tinggi dan menggabungkan RL dengan Model Bahasa Besar (LLM).

Untuk bersaing, EquiLibre memberi tumpuan kepada pendekatan "lab-first" (utamakan makmal) berbanding minda kewangan tradisional. Strategi mereka melibatkan dua tonggak utama:

  • Kecekapan berbanding Kekuatan Mentah (Brute Force): Daripada bergantung kepada kluster GPU yang besar, pasukan ini menyasarkan untuk "mendapat lebih daripada yang sedikit," dengan mengoptimumkan algoritma untuk memerah prestasi yang lebih tinggi daripada komputasi yang terhad.
  • Infrastruktur Strategik: Syarikat merancang untuk membina salah satu kluster komputasi terbesar di Eropah Tengah dan Timur (CEE) untuk memperluaskan keupayaan penyelidikannya.

Dengan berpangkalan di Prague, pengasasnya juga telah memanfaatkan diaspora Czech yang pakar dari syarikat seperti Google, membolehkan mereka membina pasukan berkaliber tinggi yang terdiri daripada 25 pakar di luar ekosistem San Francisco yang sangat kompetitif.

Ringkasan Utama

  • Evolusi Algoritma: EquiLibre berjaya memindahkan teknik pembelajaran pengukuhan yang digunakan dalam poker profesional (DeepStack) untuk menguruskan berbilion volum harian S&P 500 dan Nasdaq.
  • Penilaian Luar Biasa: Susulan Siri A yang berjaya diterajui oleh Creandum, syarikat pemula ini telah mencapai penilaian $500 juta, didorong oleh rekod prestasi "sifar bulan negatif" yang dilaporkan.
  • Kecekapan sebagai Benteng (Moat): Menghadapi gergasi dengan kelebihan perkakasan yang besar, EquiLibre memberi tumpuan kepada kecekapan algoritma dan membina infrastruktur komputasi yang signifikan di wilayah CEE.