পোকার থেকে মুনাফা: কীভাবে DeepMind-এর প্রাক্তন কর্মীরা ট্রেডিংয়ে বিপ্লব ঘটাচ্ছেন
DeepMind-এর প্রাক্তন গবেষকরা পেশাদার পোকার খেলোয়াড়দের পরাজিত করা থেকে সরে এসে এখন বিলিয়ন ডলারের মার্কেট ভলিউম বা বাজার লেনদেন পরিচালনা করছেন। প্রাগ-ভিত্তিক তাদের স্টার্টআপ, EquiLibre Technologies, কোয়ান্টিটেটিভ ফাইন্যান্সের (quantitative finance) উচ্চ-ঝুঁকিপূর্ণ জগতে রিইনফোর্সমেন্ট লার্নিং (reinforcement learning) প্রয়োগ করে বিস্ময়কর ৫০০ মিলিয়ন ডলারের মূল্যায়ন অর্জন করেছে।
পোকার কৌশলকে ওয়াল স্ট্রিটে প্রয়োগ
EquiLibre-এর মূল উদ্ভাবন হলো রিইনফোর্সমেন্ট লার্নিং (RL)-কে অপূর্ণ তথ্যের গেম (games of imperfect information) থেকে শেয়ার বাজারের জটিলতার দিকে নিয়ে আসা। এর প্রতিষ্ঠাতা ত্রয়ী—CEO Martin Schmid, CTO Rudolf Kadlec এবং CSO Matej Moravcik—পূর্বে DeepStack তৈরির জন্য খ্যাতি অর্জন করেছিলেন, যা ছিল পেশাদার নো-লিমিট টেক্সাস হোল্ড ’এম (no-limit Texas hold ’em) খেলোয়াড়দের পরাজিত করা প্রথম AI।
এর পেছনের যুক্তিটি একটি স্বাভাবিক বিবর্তন: পোকার এবং ট্রেডিং উভয় ক্ষেত্রেই অনিশ্চয়তার মধ্যে স্পষ্ট ও পরিমাপযোগ্য ফলাফলের ভিত্তিতে সর্বোত্তম সিদ্ধান্ত নিতে হয়। Schmid যেমনটি উল্লেখ করেছেন, ট্রেডিংয়ের "স্কোরিং" অত্যন্ত সহজ—এর চূড়ান্ত পুরস্কার হলো মূলধনের লাভ (capital gain)। রিইনফোর্সমেন্ট লার্নিং (RL) ব্যবহার করে, যেখানে মডেলগুলো ইনসেন্টিভযুক্ত ফিডব্যাক লুপের মাধ্যমে শেখে, EquiLibre গেমিংয়ের গণ্ডি ছাড়িয়ে S&P 500 এবং Nasdaq-এ ট্রেড পরিচালনা করছে।
বিশাল স্কেল এবং প্রমাণিত পারফরম্যান্স
EquiLibre কেবল সিমুলেশন চালাচ্ছে না; এটি সক্রিয়ভাবে বৈশ্বিক বাজারে অংশগ্রহণ করছে। কোয়ান্টিটেটিভ ফার্ম Tower Research Capital-এর সাথে অংশীদারিত্বের মাধ্যমে, স্টার্টআপটির অ্যালগরিদমগুলো প্রতিদিন বিলিয়ন বিলিয়ন ডলারের ট্রেডিং ভলিউম পরিচালনা করছে।
স্টার্টআপটির ট্র্যাক রেকর্ড বিশেষ করে এর ধারাবাহিকতার জন্য উল্লেখযোগ্য। ২০২৫ সালে ক্রিপ্টো মার্কেটে প্রাথমিক কার্যক্রম শুরুর পর, কোম্পানিটি প্রথাগত ইক্যুইটি (equities) বাজারে সম্প্রসারিত হয়েছে এবং দাবি করেছে যে, "প্রতিষ্ঠার পর থেকে তাদের কোনো নেতিবাচক মাস নেই।" এই ধরনের স্থিতিশীলতা Creandum-এর মতো ভেঞ্চার ক্যাপিটালিস্টদের জন্য একটি বড় আকর্ষণ, যারা সম্প্রতি একটি Series A রাউন্ডের নেতৃত্ব দিয়েছে যা এই ফার্মের এ যাবৎকালের বৃহত্তম একক বিনিয়োগ।
কম্পিউট এবং প্রতিভার লড়াই
যদিও EquiLibre সফলভাবে ৫০০ মিলিয়ন ডলারের মূল্যায়নে পৌঁছেছে, তবুও এটি Jane Street-এর মতো প্রতিষ্ঠিত ট্রেডিং জায়ান্টদের কাছ থেকে তীব্র প্রতিযোগিতার সম্মুখীন হচ্ছে, যারা হাজার হাজার হাই-এন্ড GPU ব্যবহার করে এবং RL-এর সাথে লার্জ ল্যাঙ্গুয়েজ মডেল (LLMs) সমন্বয় করে।
প্রতিযোগিতায় টিকে থাকতে EquiLibre প্রথাগত ফিন্যান্স মাইন্ডসেটের পরিবর্তে একটি "ল্যাব-ফার্স্ট" (lab-first) পদ্ধতির ওপর গুরুত্ব দিচ্ছে। তাদের কৌশলটি দুটি মূল স্তম্ভের ওপর ভিত্তি করে তৈরি:
- Brute Force-এর চেয়ে দক্ষতা বেশি: বিশাল GPU ক্লাস্টারের ওপর নির্ভর করার পরিবর্তে, দলটি "কম সম্পদ থেকে বেশি কিছু পাওয়া" (get more from less)-এর লক্ষ্য নির্ধারণ করেছে, যাতে সীমিত কম্পিউট থেকে সর্বোচ্চ পারফরম্যান্স বের করে আনার জন্য অ্যালগরিদমগুলোকে অপ্টিমাইজ করা যায়।
- কৌশলগত অবকাঠামো: কোম্পানিটি তাদের গবেষণার সক্ষমতা বাড়াতে মধ্য ও পূর্ব ইউরোপের (CEE) অন্যতম বৃহত্তম কম্পিউট ক্লাস্টার তৈরির পরিকল্পনা করছে।
প্রাগ-কে কেন্দ্র করে কাজ করার মাধ্যমে, প্রতিষ্ঠাতারা Google-এর মতো কোম্পানি থেকে আসা বিশেষায়িত চেক ডায়াসপোরা (Czech diaspora)-র সুবিধা গ্রহণ করেছেন, যা তাদের অতি-প্রতিযোগিতামূলক সান ফ্রান্সিসকো ইকোসিস্টেমের বাইরে ২৫ জন বিশেষজ্ঞের একটি উচ্চমানের দল গঠন করতে সাহায্য করেছে।
মূল বিষয়সমূহ
- অ্যালগরিদমিক বিবর্তন: EquiLibre পেশাদার পোকারে ব্যবহৃত রিইনফোর্সমেন্ট লার্নিং কৌশলগুলোকে (DeepStack) সফলভাবে S&P 500 এবং Nasdaq-এর প্রতিদিনের বিলিয়ন বিলিয়ন ডলারের ভলিউম পরিচালনার জন্য কাজে লাগাচ্ছে।
- বিস্ফোরক মূল্যায়ন: Creandum-এর নেতৃত্বে একটি সফল Series A-র পর, স্টার্টআপটি ৫০০ মিলিয়ন ডলারের মূল্যায়নে পৌঁছেছে, যার পেছনে রয়েছে তাদের "কোনো নেতিবাচক মাস নেই" এমন ট্র্যাক রেকর্ড।
- সুরক্ষা কবচ হিসেবে দক্ষতা: বিশাল হার্ডওয়্যার সুবিধা সম্পন্ন জায়ান্টদের মোকাবিলা করতে EquiLibre অ্যালগরিদমিক দক্ষতার ওপর এবং CEE অঞ্চলে উল্লেখযোগ্য কম্পিউট অবকাঠামো তৈরির ওপর গুরুত্ব দিচ্ছে।
