போக்கரில் இருந்து லாபம் வரை: DeepMind முன்னாள் ஊழியர்கள் வர்த்தகத் துறையில் எவ்வாறு புரட்சியை ஏற்படுத்தி வருகின்றனர்

DeepMind ஆராய்ச்சியாளர்கள் தொழில்முறை போக்கர் வீரர்களைத் தோற்கடித்த நிலையில் இருந்து, இப்போது பில்லியன் கணக்கான சந்தை வர்த்தக அளவை நிர்வகிக்கும் திசையில் திரும்பியுள்ளனர். பிராக் நகரைத் தலைமையிடமாகக் கொண்ட இவர்களது ஸ்டார்ட்அப், EquiLibre Technologies, குவாண்டிடேட்டிவ் ஃபைனான்ஸ் (quantitative finance) எனப்படும் அதிக லாபம் மற்றும் அபாயம் கொண்ட உலகில் reinforcement learning தொழில்நுட்பத்தைப் பயன்படுத்துவதன் மூலம், 500 மில்லியன் டாலர் மதிப்பிலான வியக்கத்தக்க மதிப்பீட்டைப் பெற்றுள்ளது.

போக்கர் உத்திகளை Wall Street-க்கு மாற்றுதல்

EquiLibre-ன் முக்கிய கண்டுபிடிப்பு என்பது, முழுமையான தகவல்கள் இல்லாத விளையாட்டுகளில் (games of imperfect information) பயன்படுத்தப்படும் reinforcement learning (RL) தொழில்நுட்பத்தை, பங்குச் சந்தையின் சிக்கலான சூழலுக்கு மாற்றுவதாகும். இதன் நிறுவனர்களான CEO Martin Schmid, CTO Rudolf Kadlec மற்றும் CSO Matej Moravcik ஆகியோர், தொழில்முறை no-limit Texas hold ’em வீரர்களைத் தோற்கடித்த முதல் AI ஆன DeepStack-ஐ உருவாக்கியதற்காகப் புகழ் பெற்றவர்கள்.

இந்தத் தர்க்கம் ஒரு இயற்கையான பரிணாம வளர்ச்சியாகும்: போக்கர் மற்றும் வர்த்தகம் ஆகிய இரண்டுமே நிச்சயமற்ற சூழலில் தெளிவான மற்றும் அளவிடக்கூடிய முடிவுகளுடன் சிறந்த முடிவுகளை எடுப்பதைப் பொறுத்தது. Schmid குறிப்பிடுவது போல, வர்த்தகத்தில் "மதிப்பெண்" (scoring) என்பது மிகவும் எளிமையானது—அதன் இறுதி வெகுமதி மூலதன ஆதாயம் (capital gain) மட்டுமே. ஊக்கமளிக்கும் பின்னூட்ட சுழற்சிகள் (incentivized feedback loops) மூலம் மாதிரிகள் கற்றுக்கொள்ளும் RL முறையைப் பயன்படுத்துவதன் மூலம், EquiLibre கேமிங் என்பதையும் தாண்டி S&P 500 மற்றும் Nasdaq ஆகியவற்றில் வர்த்தகங்களைச் செய்து வருகிறது.

பிரம்மாண்டமான அளவு மற்றும் நிரூபிக்கப்பட்ட செயல்திறன்

EquiLibre வெறும் உருவகப்படுத்துதல்களை (simulations) மட்டும் செய்யவில்லை; அது உலகளாவிய சந்தைகளில் தீவிரமாகப் பங்கேற்கிறது. Tower Research Capital என்ற குவாண்டிடேட்டிவ் நிறுவனத்துடன் இணைந்து, இந்த ஸ்டார்ட்அப் நிறுவனத்தின் அல்காரிதம்கள் (algorithms) தினசரி பில்லியன் கணக்கான டாலர் வர்த்தக அளவை நிர்வகித்து வருகின்றன.

இந்த ஸ்டார்ட்அப் நிறுவனத்தின் செயல்பாடுகள் அதன் தொடர்ச்சியான சிறப்பம்சத்திற்காகக் குறிப்பிடத்தக்கவை. 2025-ல் கிரிப்டோ சந்தைகளில் முதற்கட்டமாகத் தொடங்கிய பிறகு, நிறுவனம் பாரம்பரியப் பங்குகள் (traditional equities) சந்தையிலும் விரிவடைந்தது. மேலும், "தொடங்கியதிலிருந்து ஒரு மாதமும் நஷ்டம் ஏற்படாத ஒரு முழுமையான சாதனை" (perfect record of zero negative months since inception) படைத்துள்ளதாகக் கூறுகிறது. இந்த நிலைத்தன்மை, Creandum போன்ற வென்ச்சர் கேபிடலிஸ்ட்களை (venture capitalists) ஈர்க்கிறது. Creandum சமீபத்தில் ஒரு Series A சுற்று முதலீட்டை முன்னின்று நடத்தியது, இது அந்த நிறுவனத்தின் வரலாற்றிலேயே மிகப்பெரிய தனி முதலீடாகும்.

கணினித் திறன் (Compute) மற்றும் திறமையாளர்களுக்கான போட்டி

EquiLibre 500 மில்லியன் டாலர் மதிப்பீட்டை வெற்றிகரமாக எட்டியிருந்தாலும், Jane Street போன்ற ஏற்கனவே நிலைபெற்ற வர்த்தக ஜாம்பவான்களிடமிருந்து கடும் போட்டியைச் சந்திக்கிறது. Jane Street நிறுவனம் பல்லாயிரக்கணக்கான உயர்தர GPUs-களைப் பயன்படுத்துவதோடு, RL தொழில்நுட்பத்தை Large Language Models (LLMs)-உடன் இணைத்துச் செயல்படுகிறது.

போட்டியைச் சமாளிக்க, EquiLibre பாரம்பரிய நிதிச் சிந்தனைக்கு மாறாக "ஆய்வக முன்னுரிமை" (lab-first) அணுகுமுறையில் கவனம் செலுத்துகிறது. அவர்களின் உத்தி இரண்டு முக்கியத் தூண்களைக் கொண்டுள்ளது:

  • Brute Force-ஐ விட செயல்திறன் முக்கியம்: பிரம்மாண்டமான GPU கிளஸ்டர்களைச் சார்ந்திருப்பதை விட, குறைந்த வளங்களைக் கொண்டு அதிகப்படியான பலனைப் பெறுவதையே (get more from less) இந்தத் குழு நோக்கமாகக் கொண்டுள்ளது. அதாவது, வரையறுக்கப்பட்ட கணினித் திறனில் (compute) அதிக செயல்திறனைப் பெறுவதற்கு அல்காரிதம்களை மேம்படுத்துகிறது.
  • மூலோபாய உள்கட்டமைப்பு: தனது ஆராய்ச்சித் திறனை விரிவுபடுத்த, மத்திய மற்றும் கிழக்கு ஐரோப்பாவில் (CEE) மிகப்பெரிய கணினித் திறன் கிளஸ்டர்களில் (compute clusters) ஒன்றைக் கட்டத் திட்டமிட்டுள்ளது.

பிராக் நகரைத் தலைமையிடமாகக் கொண்டு செயல்படுவதன் மூலம், நிறுவனர்கள் Google போன்ற நிறுவனங்களில் பணியாற்றிய சிறப்புத் திறன் கொண்ட செக் குடியரசு வம்சாவளியினரைத் தங்கள் பக்கம் ஈர்த்துள்ளனர். இது, அதிகப்படியான போட்டி நிறைந்த சான் பிரான்சிஸ்கோ சூழலுக்கு வெளியே, 25 நிபுணர்களைக் கொண்ட ஒரு உயர்தரக் குழுவை உருவாக்க அவர்களுக்கு உதவியுள்ளது.

முக்கியக் குறிப்புகள்

  • அல்காரிதம்களின் பரிணாமம்: தொழில்முறை போக்கரில் (DeepStack) பயன்படுத்தப்படும் reinforcement learning நுட்பங்களை, தினசரி S&P 500 மற்றும் Nasdaq வர்த்தக அளவை நிர்வகிக்க EquiLibre வெற்றிகரமாகப் பயன்படுத்துகிறது.
  • அதிவேக மதிப்பீடு: Creandum தலைமையிலான வெற்றிகரமான Series A முதலீட்டைத் தொடர்ந்து, "ஒரு மாதமும் நஷ்டம் ஏற்படாத" சாதனைப் பதிவின் காரணமாக, இந்த ஸ்டார்ட்அப் 500 மில்லியன் டாலர் மதிப்பீட்டை எட்டியுள்ளது.
  • பாதுகாப்பு அரணாகச் செயல்திறன்: மிகப்பெரிய வன்பொருள் (hardware) வசதிகளைக் கொண்ட ஜாம்பவான்களை எதிர்கொள்ள, EquiLibre அல்காரிதம்களின் செயல்திறன் மற்றும் CEE பிராந்தியத்தில் குறிப்பிடத்தக்க கணினி உள்கட்டமைப்பை உருவாக்குவதில் கவனம் செலுத்துகிறது.