પોકરથી નફા સુધી: કેવી રીતે DeepMind ના ભૂતપૂર્વ કર્મચારીઓ ટ્રેડિંગમાં ક્રાંતિ લાવી રહ્યા છે

DeepMind ના ભૂતપૂર્વ સંશોધકો હવે વ્યાવસાયિક પોકર ખેલાડીઓને હરાવવાથી બજારના અબજો ડોલરના વોલ્યુમને મેનેજ કરવા તરફ વળી રહ્યા છે. તેમનું પ્રાગ (Prague) સ્થિત સ્ટાર્ટઅપ, EquiLibre Technologies, ક્વોન્ટિટેટિવ ફાઇનાન્સના ઉચ્ચ જોખમવાળા વિશ્વમાં reinforcement learning નો ઉપયોગ કરીને $500 મિલિયનનું આશ્ચર્યજનક મૂલ્યાંકન (valuation) હાંસલ કરી ચૂક્યું છે.

પોકર વ્યૂહરચનાનું વોલ સ્ટ્રીટમાં રૂપાંતર

EquiLibre ને આગળ ધપાવતું મુખ્ય સંશોધન એ reinforcement learning (RL) ને અધૂરી માહિતી ધરાવતી રમતોમાંથી શેરબજારની જટિલતાઓ તરફ લઈ જવાનું છે. તેના સ્થાપક ત્રિપુટી—CEO Martin Schmid, CTO Rudolf Kadlec, અને CSO Matej Moravcik—અગાઉ DeepStack વિકસાવવા માટે જાણીતા થયા હતા, જે વ્યાવસાયિક no-limit Texas hold ’em ખેલાડીઓને હરાવનાર પ્રથમ AI હતું.

આ તર્ક એક કુદરતી ઉત્ક્રાંતિ છે: પોકર અને ટ્રેડિંગ બંનેમાં અનિશ્ચિતતા હેઠળ સ્પષ્ટ અને માપી શકાય તેવા પરિણામો સાથે શ્રેષ્ઠ નિર્ણયો લેવાનો સમાવેશ થાય છે. જેમ કે Schmid નોંધે છે, ટ્રેડિંગમાં "સ્કોરિંગ" અત્યંત સરળ છે—અંતિમ પુરસ્કાર મૂડી વૃદ્ધિ (capital gain) છે. RL નો ઉપયોગ કરીને, જ્યાં મોડલ્સ પ્રોત્સાહિત ફીડબેક લૂપ્સ દ્વારા શીખે છે, EquiLibre ગેમિંગથી આગળ વધીને S&P 500 અને Nasdaq માં ટ્રેડિંગ કરવા માટે સક્ષમ બન્યું છે.

વિશાળ સ્કેલ અને સાબિત થયેલું પ્રદર્શન

EquiLibre માત્ર સિમ્યુલેશન જ નથી કરી રહ્યું; તે વૈશ્વિક બજારોમાં સક્રિયપણે ભાગ લઈ રહ્યું છે. ક્વોન્ટિટેટિવ ફર્મ Tower Research Capital સાથેની ભાગીદારીમાં, સ્ટાર્ટઅપના અલ્ગોરિધમ્સ દરરોજ અબજો ડોલરના ટ્રેડિંગ વોલ્યુમને મેનેજ કરી રહ્યા છે.

સ્ટાર્ટઅપનો ટ્રેક રેકોર્ડ તેની સાતત્યતા માટે ખાસ નોંધપાત્ર છે. 2025 માં ક્રિપ્ટો માર્કેટમાં શરૂઆતના રોલઆઉટ પછી, કંપનીએ પરંપરાગત ઇક્વિટીઝમાં વિસ્તરણ કર્યું, અને "સ્થાપનાથી અત્યાર સુધી શૂન્ય નકારાત્મક મહિનાઓનો સંપૂર્ણ રેકોર્ડ" હોવાનો દાવો કર્યો. સ્થિરતાનું આ સ્તર Creandum જેવા વેન્ચર કેપિટલિસ્ટ માટે મોટું આકર્ષણ છે, જેણે તાજેતરમાં Series A રાઉન્ડનું નેતૃત્વ કર્યું હતું જે કંપનીનું અત્યાર સુધીનું સૌથી મોટું સિંગલ ઇન્વેસ્ટમેન્ટ હતું.

કમ્પ્યુટ અને ટેલેન્ટ માટેની સ્પર્ધા

જોકે EquiLibre $500 મિલિયનના મૂલ્યાંકન સુધી સફળતાપૂર્વક પહોંચી ગયું છે, પરંતુ તેને Jane Street જેવા સ્થાપિત ટ્રેડિંગ જાયન્ટ્સ પાસેથી તીવ્ર સ્પર્ધાનો સામનો કરવો પડી રહ્યો છે, જેઓ હજારો હાઈ-એન્ડ GPUs નો ઉપયોગ કરે છે અને RL ને Large Language Models (LLMs) સાથે જોડે છે.

સ્પર્ધા કરવા માટે, EquiLibre પરંપરાગત ફાઇનાન્સ માઇન્ડસેટને બદલે "લેબ-ફર્સ્ટ" અભિગમ પર ધ્યાન કેન્દ્રિત કરી રહ્યું છે. તેમની વ્યૂહરચનામાં બે મુખ્ય સ્તંભો સામેલ છે:

  • Brute Force કરતા કાર્યક્ષમતા પર ધ્યાન: વિશાળ GPU ક્લસ્ટર્સ પર આધાર રાખવાને બદલે, ટીમનો ઉદ્દેશ્ય "ઓછામાં વધુ મેળવવાનો" છે, જે મર્યાદિત કમ્પ્યુટમાંથી વધુ સારું પ્રદર્શન મેળવવા માટે અલ્ગોરિધમ્સને ઓપ્ટિમાઇઝ કરે છે.
  • વ્યૂહાત્મક ઇન્ફ્રાસ્ટ્રક્ચર: કંપની તેની સંશોધન ક્ષમતાઓને વધારવા માટે મધ્ય અને પૂર્વી યુરોપ (CEE) માં સૌથી મોટા કમ્પ્યુટ ક્લસ્ટર્સમાંનું એક બનાવવાનું આયોજન કરી રહી છે.

પ્રાગમાં પોતાનું બેઝ બનાવીને, સ્થાપકોએ Google જેવી કંપનીઓમાંથી આવતા વિશિષ્ટ ચેક ડિસ્પોરા (Czech diaspora) નો લાભ લીધો છે, જેનાથી તેઓ અત્યંત સ્પર્ધાત્મક સેન ફ્રાન્સિસ્કો ઇકોસિસ્ટમની બહાર 25 નિષ્ણાતોની ઉચ્ચ કક્ષાની ટીમ બનાવી શક્યા છે.

મુખ્ય મુદ્દાઓ

  • અલ્ગોરિધમિક ઉત્ક્રાંતિ: EquiLibre વ્યાવસાયિક પોકરમાં (DeepStack) વપરાતી reinforcement learning તકનીકોને સફળતાપૂર્વક S&P 500 અને Nasdaq ના દરરોજના અબજો ડોલરના વોલ્યુમને મેનેજ કરવા માટે ઉપયોગમાં લઈ રહ્યું છે.
  • ઝડપી મૂલ્યાંકન: Creandum ના નેતૃત્વ હેઠળના સફળ Series A પછી, સ્ટાર્ટઅપ $500 મિલિયનના મૂલ્યાંકન સુધી પહોંચ્યું છે, જે તેના "શૂન્ય નકારાત્મક મહિનાઓ" ના ટ્રેક રેકોર્ડ દ્વારા સંચાલિત છે.
  • Moat તરીકે કાર્યક્ષમતા: વિશાળ હાર્ડવેર લાભો ધરાવતા જાયન્ટ્સનો સામનો કરતી વખતે, EquiLibre અલ્ગોરિધમિક કાર્યક્ષમતા અને CEE પ્રદેશમાં નોંધપાત્ર કમ્પ્યુટ ઇન્ફ્રાસ્ટ્રક્ચર બનાવવા પર ધ્યાન કેન્દ્રિત કરી રહ્યું છે.