ಪೋಕರ್ನಿಂದ ಲಾಭದವರೆಗೆ: ಡೀಪ್ಮೈಂಡ್ (DeepMind) ಹಳೆಯ ಸಿಬ್ಬಂದಿಗಳು ಟ್ರೇಡಿಂಗ್ ಕ್ಷೇತ್ರದಲ್ಲಿ ಕ್ರಾಂತಿ ಮಾಡುತ್ತಿರುವುದು ಹೇಗೆ
ಮಾಜಿ DeepMind ಸಂಶೋಧಕರು ವೃತ್ತಿಪರ ಪೋಕರ್ ಆಟಗಾರರನ್ನು ಸೋಲಿಸುವುದರಿಂದ ಮಾರುಕಟ್ಟೆಯ ಶತಕೋಟಿ ಡಾಲರ್ಗಳ ವಹಿವಾಟನ್ನು ನಿರ್ವಹಿಸುವತ್ತ ತಮ್ಮ ಗಮನವನ್ನು ಹರಿಸುತ್ತಿದ್ದಾರೆ. ಪ್ರಾಗ್ ಮೂಲದ ಅವರ ಸ್ಟಾರ್ಟ್ಅಪ್, EquiLibre Technologies, ಕ್ವಾಂಟಿಟೇಟಿವ್ ಫೈನಾನ್ಸ್ನ (quantitative finance) ಹೆಚ್ಚಿನ ಅಪಾಯದ ಜಗತ್ತಿಗೆ ರಿಇನ್ಫೋರ್ಸ್ಮೆಂಟ್ ಲರ್ನಿಂಗ್ (reinforcement learning) ಅನ್ನು ಅನ್ವಯಿಸುವ ಮೂಲಕ $500 ಮಿಲಿಯನ್ ಅಚ್ಚರಿಯ ಮೌಲ್ಯಮಾಪನವನ್ನು ಸಾಧಿಸಿದೆ.
ಪೋಕರ್ ತಂತ್ರವನ್ನು ವಾರ್ ಸ್ಟ್ರೀಟ್ಗೆ ಅನ್ವಯಿಸುವುದು
EquiLibre ಅನ್ನು ಮುನ್ನಡೆಸುತ್ತಿರುವ ಪ್ರಮುಖ ನಾವೀನ್ಯತೆಯೆಂದರೆ, ಅಪೂರ್ಣ ಮಾಹಿತಿಯ ಆಟಗಳಿಂದ (games of imperfect information) ಸ್ಟಾಕ್ ಮಾರುಕಟ್ಟೆಯ ಸಂಕೀರ್ಣತೆಗಳಿಗೆ ರಿಇನ್ಫೋರ್ಸ್ಮೆಂಟ್ ಲರ್ನಿಂಗ್ (RL) ಅನ್ನು ವರ್ಗಾಯಿಸುವುದು. ಸಂಸ್ಥೆಯ ಸ್ಥಾಪಕ ತ್ರಯ—CEO Martin Schmid, CTO Rudolf Kadlec, ಮತ್ತು CSO Matej Moravcik—ವೃತ್ತಿಪರ 'ನೋ-ಲಿಮಿಟ್ ಟೆಕ್ಸಾಸ್ ಹೋಲ್ಡ್ ’ಮ್' (no-limit Texas hold ’em) ಆಟಗಾರರನ್ನು ಸೋಲಿಸಿದ ಮೊದಲ AI ಆದ DeepStack ಅನ್ನು ಅಭಿವೃದ್ಧಿಪಡಿಸಿದ್ದಕ್ಕಾಗಿ ಹಿಂದೆ ಖ್ಯಾತಿ ಗಳಿಸಿದ್ದರು.
ಇದರ ತರ್ಕವು ಒಂದು ನೈಸರ್ಗಿಕ ವಿಕಾಸವಾಗಿದೆ: ಪೋಕರ್ ಮತ್ತು ಟ್ರೇಡಿಂಗ್ ಎರಡೂ ಅನಿಶ್ಚಿತತೆಯ ನಡುವೆ ಸ್ಪಷ್ಟವಾದ, ಅಳೆಯಬಹುದಾದ ಫಲಿತಾಂಶಗಳೊಂದಿಗೆ ಅತ್ಯುತ್ತಮ ನಿರ್ಧಾರಗಳನ್ನು ತೆಗೆದುಕೊಳ್ಳುವುದನ್ನು ಒಳಗೊಂಡಿರುತ್ತವೆ. Schmid ಗಮನಿಸಿದಂತೆ, ಟ್ರೇಡಿಂಗ್ನಲ್ಲಿ "ಸ್ಕೋರಿಂಗ್" ಅತ್ಯಂತ ಸರಳವಾಗಿದೆ—ಅಂತಿಮ ಪ್ರತಿಫಲವೆಂದರೆ ಬಂಡವಾಳದ ಲಾಭ (capital gain). ಪ್ರೋತ್ಸಾಹಿತ ಫೀಡ್ಬ್ಯಾಕ್ ಲೂಪ್ಗಳ (incentivized feedback loops) ಮೂಲಕ ಮಾದರಿಗಳು ಕಲಿಯುವ RL ಅನ್ನು ಬಳಸುವ ಮೂಲಕ, EquiLibre ಗೇಮಿಂಗ್ಗಿಂತ ಮುಂದೆ ಸಾಗಿ S&P 500 ಮತ್ತು Nasdaq ನಲ್ಲಿ ವ್ಯಾಪಾರಗಳನ್ನು (trades) ನಡೆಸುತ್ತಿದೆ.
ಬೃಹತ್ ಪ್ರಮಾಣ ಮತ್ತು ಸಾಬೀತಾದ ಕಾರ್ಯಕ್ಷಮತೆ
EquiLibre ಕೇವಲ ಸಿಮ್ಯುಲೇಶನ್ಗಳನ್ನು ನಡೆಸುತ್ತಿಲ್ಲ; ಇದು ಜಾಗತಿಕ ಮಾರುಕಟ್ಟೆಗಳಲ್ಲಿ ಸಕ್ರಿಯವಾಗಿ ಭಾಗವಹಿಸುತ್ತಿದೆ. ಕ್ವಾಂಟಿಟೇಟಿವ್ ಸಂಸ್ಥೆಯಾದ Tower Research Capital ನೊಂದಿಗೆ ಪಾಲುದಾರಿಕೆಯಲ್ಲಿರುವ ಈ ಸ್ಟಾರ್ಟ್ಅಪ್ನ ಅಲ್ಗಾರಿದಮ್ಗಳು ಪ್ರತಿದಿನ ಶತಕೋಟಿ ಡಾಲರ್ಗಳ ವ್ಯಾಪಾರ ವಹಿವಾಟನ್ನು ನಿರ್ವಹಿಸುತ್ತಿವೆ.
ಈ ಸ್ಟಾರ್ಟ್ಅಪ್ನ ಸಾಧನೆಯ ದಾಖಲೆ ಅದರ ಸ್ಥಿರತೆಗಾಗಿ ವಿಶೇಷವಾಗಿ ಗಮನಾರ್ಹವಾಗಿದೆ. 2025 ರಲ್ಲಿ ಕ್ರಿಪ್ಟೋ ಮಾರುಕಟ್ಟೆಗಳಲ್ಲಿ ಆರಂಭಿಕ ಬಿಡುಗಡೆಯ ನಂತರ, ಕಂಪನಿಯು ಸಾಂಪ್ರದಾಯಿಕ ಇಕ್ವಿಟಿಗಳಿಗೆ ವಿಸ್ತರಿಸಿತು ಮತ್ತು "ಸ್ಥಾಪನೆಯಾದಾಗಿನಿಂದ ಶೂನ್ಯ ನಕಾರಾತ್ಮಕ ತಿಂಗಳುಗಳ ಪರಿಪೂರ್ಣ ದಾಖಲೆ" ಹೊಂದಿದೆ ಎಂದು ಹೇಳಿಕೊಂಡಿದೆ. ಈ ಮಟ್ಟದ ಸ್ಥಿರತೆಯು Creandum ನಂತಹ ವೆಂಚರ್ ಕ್ಯಾಪಿಟಲಿಸ್ಟ್ಗಳಿಗೆ ದೊಡ್ಡ ಆಕರ್ಷಣೆಯಾಗಿದೆ, ಇತ್ತೀಚೆಗೆ ಅವರು ನಡೆಸಿದ ಸೀರೀಸ್ A ರೌಂಡ್ ಸಂಸ್ಥೆಯ ಇಂದಿನವರೆಗಿನ ಅತಿದೊಡ್ಡ ಏಕೈಕ ಹೂಡಿಕೆಯಾಗಿದೆ.
ಕಂಪ್ಯೂಟ್ ಮತ್ತು ಪ್ರತಿಭೆಗಾಗಿ ಪೈಪೋಟಿ
EquiLibre ಯಶಸ್ವಿಯಾಗಿ $500 ಮಿಲಿಯನ್ ಮೌಲ್ಯಮಾಪನಕ್ಕೆ ತಲುಪಿದ್ದರೂ, ಇದು Jane Street ನಂತಹ ಸ್ಥಾಪಿತ ಟ್ರೇಡಿಂಗ್ ದೈತ್ಯರಿಂದ ತೀವ್ರ ಪೈಪೋಟಿಯನ್ನು ಎದುರಿಸುತ್ತಿದೆ. Jane Street ಹತ್ತಾರು ಸಾವಿರ ಹೈ-ಎಂಡ್ GPUಗಳನ್ನು ಬಳಸುತ್ತದೆ ಮತ್ತು RL ಅನ್ನು Large Language Models (LLMs) ನೊಂದಿಗೆ ಸಂಯೋಜಿಸುತ್ತದೆ.
ಪೈಪೋಟಿ ನೀಡಲು, EquiLibre ಸಾಂಪ್ರದಾಯಿಕ ಹಣಕಾಸು ಮನೋಭಾವದ ಬದಲಿಗೆ "ಲ್ಯಾಬ್-ಫಸ್ಟ್" (lab-first) ವಿಧಾನದ ಮೇಲೆ ಗಮನ ಹರಿಸುತ್ತಿದೆ. ಅವರ ಕಾರ್ಯತಂತ್ರವು ಎರಡು ಪ್ರಮುಖ ಸ್ತಂಭಗಳನ್ನು ಒಳಗೊಂಡಿದೆ:
- ಬ್ರೂಟ್ ಫೋರ್ಸ್ (Brute Force) ಗಿಂತ ದಕ್ಷತೆ: ಬೃಹತ್ GPU ಕ್ಲಸ್ಟರ್ಗಳ ಮೇಲೆ ಅವಲಂಬಿತವಾಗುವ ಬದಲು, ತಂಡವು ಸೀಮಿತ ಕಂಪ್ಯೂಟ್ನಿಂದ ಹೆಚ್ಚಿನ ಕಾರ್ಯಕ್ಷಮತೆಯನ್ನು ಪಡೆಯಲು ಅಲ್ಗಾರಿದಮ್ಗಳನ್ನು ಉತ್ತಮಗೊಳಿಸುವ ಮೂಲಕ "ಕಡಿಮೆ ಸಂಪನ್ಮೂಲದಿಂದ ಹೆಚ್ಚು ಪಡೆಯಲು" ಗುರಿಯಾಗಿಸಿಕೊಂಡಿದೆ.
- ಕಾರ್ಯತಂತ್ರದ ಮೂಲಸೌಕರ್ಯ: ಕಂಪನಿಯು ತನ್ನ ಸಂಶೋಧನಾ ಸಾಮರ್ಥ್ಯವನ್ನು ವಿಸ್ತರಿಸಲು ಮಧ್ಯ ಮತ್ತು ಪೂರ್ವ ಯುರೋಪ್ನಲ್ಲಿ (CEE) ಅತಿದೊಡ್ಡ ಕಂಪ್ಯೂಟ್ ಕ್ಲಸ್ಟರ್ಗಳಲ್ಲಿ ಒಂದನ್ನು ನಿರ್ಮಿಸಲು ಯೋಜಿಸಿದೆ.
ಪ್ರಾಗ್ನಲ್ಲಿ ತಮ್ಮ ನೆಲೆಗಟ್ಟನ್ನು ಸ್ಥಾಪಿಸುವ ಮೂಲಕ, ಸಂಸ್ಥಾಪಕರು Google ನಂತಹ ಕಂಪನಿಗಳಿಂದ ಬಂದಿರುವ ವಿಶೇಷವಾದ ಚೆಕ್ ಡಯಾಸ್ಪೊರಾದ (Czech diaspora) ಅನುಭವವನ್ನು ಬಳಸಿಕೊಳ್ಳುತ್ತಿದ್ದಾರೆ. ಇದು ಅತೀ ಹೆಚ್ಚು ಸ್ಪರ್ಧಾತ್ಮಕವಾದ ಸ್ಯಾನ್ ಫ್ರಾನ್ಸಿಸ್ಕೋ ಪರಿಸರ ವ್ಯವಸ್ಥೆಯ ಹೊರಗೆ 25 ತಜ್ಞರ ಉನ್ನತ ಮಟ್ಟದ ತಂಡವನ್ನು ನಿರ್ಮಿಸಲು ಅವರಿಗೆ ಅನುವು ಮಾಡಿಕೊಟ್ಟಿದೆ.
ಪ್ರಮುಖ ಅಂಶಗಳು
- ಅಲ್ಗಾರಿದಮಿಕ್ ವಿಕಾಸ: ವೃತ್ತಿಪರ ಪೋಕರ್ನಲ್ಲಿ (DeepStack) ಬಳಸಲಾಗುವ ರಿಇನ್ಫೋರ್ಸ್ಮೆಂಟ್ ಲರ್ನಿಂಗ್ ತಂತ್ರಗಳನ್ನು ಪ್ರತಿದಿನದ S&P 500 ಮತ್ತು Nasdaq ವಹಿವಾಟನ್ನು ನಿರ್ವಹಿಸಲು EquiLibre ಯಶಸ್ವಿಯಾಗಿ ಅಳವಡಿಸಿಕೊಳ್ಳುತ್ತಿದೆ.
- ಅಭೂತಪೂರ್ವ ಮೌಲ್ಯಮಾಪನ: Creandum ನೇತೃತ್ವದ ಯಶಸ್ವಿ ಸೀರೀಸ್ A ನಂತರ, "ಶೂನ್ಯ ನಕಾರಾತ್ಮಕ ತಿಂಗಳುಗಳ" ದಾಖಲೆಯ ನೆರವಿನೊಂದಿಗೆ ಸ್ಟಾರ್ಟ್ಅಪ್ $500 ಮಿಲಿಯನ್ ಮೌಲ್ಯಮಾಪನವನ್ನು ತಲುಪಿದೆ.
- ದಕ್ಷತೆಯೇ ರಕ್ಷಾಕವಚ (Moat): ಬೃಹತ್ ಹಾರ್ಡ್ವೇರ್ ಅನುಕೂಲಗಳನ್ನು ಹೊಂದಿರುವ ದೈತ್ಯ ಕಂಪನಿಗಳನ್ನು ಎದುರಿಸಲು, EquiLibre ಅಲ್ಗಾರಿದಮಿಕ್ ದಕ್ಷತೆಯ ಮೇಲೆ ಮತ್ತು CEE ಪ್ರದೇಶದಲ್ಲಿ ಗಮನಾರ್ಹ ಕಂಪ್ಯೂಟ್ ಮೂಲಸೌಕರ್ಯವನ್ನು ನಿರ್ಮಿಸುವಿಕೆಯ ಮೇಲೆ ಗಮನ ಹರಿಸುತ್ತಿದೆ.
