पोकरपासून नफ्यापर्यंत: DeepMind चे माजी कर्मचारी ट्रेडिंग क्षेत्रात कशी क्रांती घडवत आहेत
DeepMind चे माजी संशोधक आता व्यावसायिक पोकर खेळाडूंना हरवण्यापासून थेट अब्जावधी डॉलर्सच्या मार्केट वॉल्यूमचे व्यवस्थापन करण्याकडे वळत आहेत. प्रागस्थित त्यांचे स्टार्टअप, EquiLibre Technologies, ने क्वांटिटेटिव्ह फायनान्सच्या (quantitative finance) उच्च-धोक्याच्या जगात reinforcement learning चा वापर करून ५०० दशलक्ष डॉलर्सचे नेत्रदीपक मूल्यांकन (valuation) प्राप्त केले आहे.
पोकरची रणनीती वॉल स्ट्रीटवर लागू करणे
EquiLibre ला चालवणारे मुख्य नाविन्य म्हणजे reinforcement learning (RL) चा अपूर्ण माहिती असलेल्या खेळांमधून शेअर बाजारातील गुंतागुंतीच्या प्रक्रियेकडे केलेला प्रवास. या स्टार्टअपचे संस्थापक त्रिकूट—CEO Martin Schmid, CTO Rudolf Kadlec आणि CSO Matej Moravcik—यांनी यापूर्वी DeepStack विकसित केल्याबद्दल प्रसिद्धी मिळवली होती, जे व्यावसायिक no-limit Texas hold ’em खेळाडूंना हरवणारे पहिले AI होते.
हे तर्कशास्त्र एक नैसर्गिक उत्क्रांती आहे: पोकर आणि ट्रेडिंग दोन्हीमध्ये अनिश्चिततेच्या परिस्थितीत स्पष्ट आणि मोजता येण्याजोग्या परिणामांसह सर्वोत्तम निर्णय घेणे समाविष्ट असते. Schmid यांच्या मते, ट्रेडिंगमधील "स्कोअरिंग" अत्यंत साधे आहे—अंतिम रिवॉर्ड म्हणजे भांडवली नफा (capital gain). RL चा वापर करून, जिथे मॉडेल्स प्रोत्साहन देणाऱ्या फीडबॅक लूप्सद्वारे शिकतात, EquiLibre ने केवळ गेमिंगपुरते मर्यादित न राहता S&P 500 आणि Nasdaq मध्ये ट्रेड करणे सुरू केले आहे.
प्रचंड व्याप्ती आणि सिद्ध कामगिरी
EquiLibre केवळ सिम्युलेशन (simulations) चालवत नाहीये; ते जागतिक बाजारपेठेत सक्रियपणे सहभागी आहे. Tower Research Capital या क्वांटिटेटिव्ह फर्मसोबतच्या भागीदारीत, या स्टार्टअपचे अल्गोरिदम दररोज अब्जावधी डॉलर्सच्या ट्रेडिंग वॉल्यूमचे व्यवस्थापन करत आहेत.
या स्टार्टअपचा ट्रॅक रेकॉर्ड त्याच्या सातत्यासाठी विशेष उल्लेखनीय आहे. २०२५ मध्ये क्रिप्टो मार्केटमध्ये सुरुवातीच्या लाँच नंतर, कंपनीने पारंपारिक इक्विटीमध्ये विस्तार केला आणि "स्थापनेपासून शून्य नकारात्मक महिने" असा आपला परिपूर्ण रेकॉर्ड असल्याचा दावा केला. ही स्थिरता Creandum सारख्या व्हेंचर कॅपिटलिस्टसाठी मोठे आकर्षण आहे, ज्यांनी अलीकडेच Series A राउंडचे नेतृत्व केले, जो या फर्मचा आतापर्यंतचा सर्वात मोठा एकल गुंतवणूक प्रकार ठरला आहे.
कॉम्प्युट आणि टॅलेंटसाठीची स्पर्धा
जरी EquiLibre ने ५०० दशलक्ष डॉलर्सचे मूल्यांकन यशस्वीरित्या प्राप्त केले असले, तरी त्याला Jane Street सारख्या प्रस्थापित ट्रेडिंग दिग्गजांकडून तीव्र स्पर्धा आहे, जे हजारो हाय-एंड GPUs वापरतात आणि RL ला Large Language Models (LLMs) सोबत जोडतात.
स्पर्धा करण्यासाठी, EquiLibre पारंपारिक फायनान्स माइंडसेटऐवजी "lab-first" दृष्टिकोनावर लक्ष केंद्रित करत आहे. त्यांच्या रणनीतीमध्ये दोन मुख्य स्तंभ आहेत:
- Brute Force पेक्षा कार्यक्षमता महत्त्वाची: प्रचंड GPU क्लस्टर्सवर अवलंबून राहण्याऐवजी, टीमचे उद्दिष्ट "कमी संसाधनांतून अधिक मिळवणे" हे आहे, जेणेकरून मर्यादित कॉम्प्युटमधून उच्च कामगिरी मिळवण्यासाठी अल्गोरिदम ऑप्टिमाइझ करता येतील.
- धोरणात्मक पायाभूत सुविधा: कंपनी आपल्या संशोधन क्षमता वाढवण्यासाठी मध्य आणि पूर्व युरोपमध्ये (CEE) सर्वात मोठ्या कॉम्प्युट क्लस्टर्सपैकी एक उभारण्याचे नियोजन करत आहे.
प्रागमध्ये आपले मुख्यालय ठेवून, संस्थापकांनी Google सारख्या कंपन्यांमधील विशेष चेक डायस्पोराचा (Czech diaspora) फायदा घेतला आहे, ज्यामुळे त्यांना अतिशय स्पर्धात्मक असलेल्या सॅन फ्रान्सिस्को इकोसिस्टमच्या बाहेर २५ तज्ज्ञांची उच्च दर्जाची टीम तयार करणे शक्य झाले आहे.
मुख्य निष्कर्ष
- अल्गोरिदममधील उत्क्रांती: EquiLibre व्यावसायिक पोकरमध्ये (DeepStack) वापरल्या जाणाऱ्या reinforcement learning तंत्रांचा यशस्वीरित्या वापर करून दररोज S&P 500 आणि Nasdaq मधील अब्जावधी डॉलर्सच्या वॉल्यूमचे व्यवस्थापन करत आहे.
- धडाकेबाज मूल्यांकन: Creandum च्या नेतृत्वाखालील यशस्वी Series A नंतर, स्टार्टअपने ५०० दशलक्ष डॉलर्सचे मूल्यांकन प्राप्त केले आहे, ज्याला "शून्य नकारात्मक महिने" असलेल्या ट्रॅक रेकॉर्डचा आधार आहे.
- कार्यक्षमता हीच सुरक्षा (Moat): प्रचंड हार्डवेअर फायदे असलेल्या दिग्गजांचा सामना करताना, EquiLibre अल्गोरिदमची कार्यक्षमता आणि CEE प्रदेशात महत्त्वपूर्ण कॉम्प्युट इन्फ्रास्ट्रक्चर उभारण्यावर लक्ष केंद्रित करत आहे.
