പോക്കറിൽ നിന്ന് ലാഭത്തിലേക്ക്: ഡീപ് മൈൻഡ് (DeepMind) മുൻ ജീവനക്കാർ ട്രേഡിംഗ് രംഗത്ത് വിപ്ലവം സൃഷ്ടിക്കുന്നത് എങ്ങനെ

പ്രൊഫഷണൽ പോക്കർ കളിക്കാരെ തോൽപ്പിക്കുന്നത് മുതൽ കോടിക്കണക്കിന് ഡോളറിന്റെ വിപണി ഇടപാടുകൾ നിയന്ത്രിക്കുന്നത് വരെയാണ് മുൻ ഡീപ് മൈൻഡ് (DeepMind) ഗവേഷകർ ഇപ്പോൾ ലക്ഷ്യമിടുന്നത്. പ്രാഗ് ആസ്ഥാനമായുള്ള അവരുടെ സ്റ്റാർട്ടപ്പായ EquiLibre Technologies, ക്വാണ്ടിറ്റേറ്റീവ് ഫിനാൻസിന്റെ (quantitative finance) ഉയർന്ന റിസ്കുള്ള ലോകത്ത് റീഇൻഫോഴ്‌സ്‌മെന്റ് ലേണിംഗ് (reinforcement learning) പ്രയോഗിച്ചുകൊണ്ട് 500 മില്യൺ ഡോളറിന്റെ വിസ്മയിപ്പിക്കുന്ന മൂല്യം കൈവരിച്ചിരിക്കുന്നു.

പോക്കർ തന്ത്രങ്ങളെ വോൾ സ്ട്രീറ്റിലേക്ക് മാറ്റുന്നു

അറിവ് അപൂർണ്ണമായ ഗെയിമുകളിൽ നിന്നുള്ള റീഇൻഫോഴ്‌സ്‌മെന്റ് ലേണിംഗിനെ (RL) ഓഹരി വിപണിയുടെ സങ്കീർണ്ണതകളിലേക്ക് മാറ്റുന്നതാണ് EquiLibre-ന്റെ പ്രധാന നവീകരണം. സിഇഒ മാർട്ടിൻ ഷ്മിഡ് (Martin Schmid), സിടിഒ റുഡോൾഫ് കാഡ്ലെക് (Rudolf Kadlec), സിഎസ്ഒ മാറ്റെജ് മോറാവ്‌സിക് (Matej Moravcik) എന്നിവരടങ്ങുന്ന സ്ഥാപക സംഘം, പ്രൊഫഷണൽ നോ-ലിമിറ്റ് ടെക്സസ് ഹോൾഡ് എം (no-limit Texas hold ’em) കളിക്കാരെ തോൽപ്പിക്കാൻ കഴിഞ്ഞ ആദ്യ എഐ ആയ DeepStack വികസിപ്പിച്ചെടുത്തതിലൂടെ നേരത്തെ തന്നെ പ്രശസ്തരായിട്ടുണ്ട്.

ഇതിന്റെ യുക്തി സ്വാഭാവികമായ ഒരു പരിണാമമാണ്: പോക്കറും ട്രേഡിംഗും ഒരുപോലെ അനിശ്ചിതത്വങ്ങൾക്കിടയിൽ വ്യക്തവും അളക്കാവുന്നതുമായ ഫലങ്ങളോടെ മികച്ച തീരുമാനങ്ങൾ എടുക്കുന്നതിനെ ആശ്രയിച്ചിരിക്കുന്നു. ഷ്മിഡ് പറയുന്നതുപോലെ, ട്രേഡിംഗിലെ "സ്കോറിംഗ്" വളരെ ലളിതമാണ്—അന്തിമ പ്രതിഫലം മൂലധന ലാഭമാണ് (capital gain). ഇൻസെന്റൈസ്ഡ് ഫീഡ്‌ബാക്ക് ലൂപ്പുകളിലൂടെ മോഡലുകൾ പഠിക്കുന്ന RL ഉപയോഗിക്കുന്നതിലൂടെ, ഗെയിമിംഗിന് അപ്പുറം S&P 500, Nasdaq എന്നിവയിലുടനീളം ഇടപാടുകൾ നടത്താൻ EquiLibre-ന് സാധിക്കുന്നു.

വൻതോതിലുള്ള പ്രവർത്തനവും തെളിയിക്കപ്പെട്ട പ്രകടനവും

EquiLibre വെറുമൊരു സിമുലേഷൻ മാത്രമല്ല നടത്തുന്നത്; അത് ആഗോള വിപണികളിൽ സജീവമായി പങ്കെടുക്കുന്നുമുണ്ട്. ക്വാണ്ടിറ്റേറ്റീവ് സ്ഥാപനമായ Tower Research Capital-മായി ചേർന്നുള്ള പങ്കാളിത്തത്തിലൂടെ, സ്റ്റാർട്ടപ്പിന്റെ അൽഗോരിതങ്ങൾ പ്രതിദിനം കോടിക്കണക്കിന് ഡോളറിന്റെ ട്രേഡിംഗ് വോളിയം കൈകാര്യം ചെയ്യുന്നു.

സ്റ്റാർട്ടപ്പിന്റെ പ്രവർത്തന മികവ് അതിന്റെ സ്ഥിരതയിലാണ് പ്രകടമാകുന്നത്. 2025-ൽ ക്രിപ്റ്റോ വിപണിയിൽ നടത്തിയ ആദ്യഘട്ട പ്രവർത്തനത്തിന് ശേഷം, കമ്പനി പരമ്പരാഗത ഓഹരി വിപണിയിലേക്ക് പ്രവർത്തനം വ്യാപിപ്പിച്ചു. "സ്ഥാപനം തുടങ്ങിയത് മുതൽ ഒരു നെഗറ്റീവ് മാസവും ഇല്ലാത്ത മികച്ച റെക്കോർഡ്" കമ്പനി അവകാശപ്പെടുന്നു. ഈ സ്ഥിരതയാണ് Creandum പോലുള്ള വെഞ്ചർ ക്യാപിറ്റലിസ്റ്റുകളെ ആകർഷിക്കുന്നത്. അടുത്തിടെ നടന്ന കമ്പനിയുടെ ഏറ്റവും വലിയ നിക്ഷേപമായ സീരീസ് എ (Series A) റൗണ്ടിന് നേതൃത്വം നൽകിയത് Creandum ആണ്.

കമ്പ്യൂട്ട് ശേഷിക്കും പ്രതിഭയ്ക്കും വേണ്ടിയുള്ള മത്സരം

EquiLibre 500 മില്യൺ ഡോളർ മൂല്യത്തിലേക്ക് വിജയകരമായി വളർന്നെങ്കിലും, Jane Street പോലുള്ള പ്രമുഖ ട്രേഡിംഗ് ഭീമന്മാരിൽ നിന്ന് കടുത്ത മത്സരം നേരിടേണ്ടി വരുന്നുണ്ട്. പതിനായിരക്കണക്കിന് ഹൈ-എൻഡ് GPU-കൾ ഉപയോഗിക്കുന്ന Jane Street, RL-നെ ലാർജ് ലാംഗ്വേജ് മോഡലുകളുമായി (LLMs) സംയോജിപ്പിക്കുന്നു.

മത്സരത്തിൽ മുന്നിലെത്താൻ, പരമ്പരാഗത ഫിനാൻസ് രീതികൾക്ക് പകരം "ലാബ്-ഫസ്റ്റ്" (lab-first) സമീപനത്തിലാണ് EquiLibre ശ്രദ്ധ കേന്ദ്രീകരിക്കുന്നത്. അവരുടെ തന്ത്രം രണ്ട് പ്രധാന തൂണുകളിൽ അധിഷ്ഠിതമാണ്:

  • ബലപ്രയോഗത്തേക്കാൾ കാര്യക്ഷമത: വൻതോതിലുള്ള GPU ക്ലസ്റ്ററുകളെ ആശ്രയിക്കുന്നതിന് പകരം, പരിമിതമായ കമ്പ്യൂട്ട് ശേഷിയിൽ നിന്ന് ഉയർന്ന പ്രകടനം നേടിയെടുക്കുന്നതിനായി അൽഗോരിതങ്ങൾ ഒപ്റ്റിമൈസ് ചെയ്യാനും "കുറഞ്ഞ വിഭവങ്ങളിൽ നിന്ന് കൂടുതൽ നേടാനും" ആണ് ടീം ലക്ഷ്യമിടുന്നത്.
  • തന്ത്രപരമായ ഇൻഫ്രാസ്ട്രക്ചർ: ഗവേഷണ ശേഷി വർദ്ധിപ്പിക്കുന്നതിനായി മധ്യ-കിഴക്കൻ യൂറോപ്പിലെ (CEE) ഏറ്റവും വലിയ കമ്പ്യൂട്ട് ക്ലസ്റ്ററുകളിൽ ഒന്ന് നിർമ്മിക്കാൻ കമ്പനി പദ്ധതിയിടുന്നു.

പ്രാഗിൽ ആസ്ഥാനമാക്കിയുള്ളതിലൂടെ, ഗൂഗിൾ പോലുള്ള കമ്പനികളിൽ നിന്നുള്ള വിദഗ്ധരായ ചെക്ക് ഡയസ്‌പോറയെ (Czech diaspora) പ്രയോജനപ്പെടുത്താൻ സ്ഥാപകർക്ക് കഴിഞ്ഞു. ഇത് സാൻ ഫ്രാൻസിസ്കോയിലെ അതിശക്തമായ മത്സരങ്ങൾക്കിടയിൽ നിന്ന് മാറി, 25 വിദഗ്ധരടങ്ങുന്ന ഉയർന്ന നിലവാരമുള്ള ഒരു ടീമിനെ കെട്ടിപ്പടുക്കാൻ അവരെ സഹായിച്ചു.

പ്രധാന കാര്യങ്ങൾ

  • അൽഗോരിതമിക് പരിണാമം: പ്രൊഫഷണൽ പോക്കറിൽ (DeepStack) ഉപയോഗിച്ചിരുന്ന റീഇൻഫോഴ്‌സ്‌മെന്റ് ലേണിംഗ് സാങ്കേതികവിദ്യകൾ വിജയകരമായി ഉപയോഗപ്പെടുത്തിക്കൊണ്ട്, പ്രതിദിനം കോടിക്കണക്കിന് ഡോളറിന്റെ S&P 500, Nasdaq ഇടപാടുകൾ EquiLibre കൈകാര്യം ചെയ്യുന്നു.
  • അതിവേഗ മൂല്യവർദ്ധനവ്: Creandum നയിച്ച വിജയകരമായ സീരീസ് എ റൗണ്ടിനെത്തുടർന്ന്, "ഒരു നെഗറ്റീവ് മാസവും ഇല്ലാത്ത" പ്രവർത്തന മികവ് മൂലം സ്റ്റാർട്ടപ്പ് 500 മില്യൺ ഡോളർ മൂല്യത്തിലെത്തി.
  • കാര്യക്ഷമത ഒരു കരുത്തായി: വൻതോതിലുള്ള ഹാർഡ്‌വെയർ സൗകര്യങ്ങളുള്ള ഭീമന്മാരോട് മത്സരിക്കാൻ, അൽഗോരിതമിക് കാര്യക്ഷമതയിലും മധ്യ-കിഴക്കൻ യൂറോപ്പ് (CEE) മേഖലയിൽ മികച്ച കമ്പ്യൂട്ട് ഇൻഫ്രാസ്ട്രക്ചർ നിർമ്മിക്കുന്നതിലുമാണ് EquiLibre ശ്രദ്ധ കേന്ദ്രീകരിക്കുന്നത്.