من البوكر إلى الأرباح: كيف يُحدث خريجو DeepMind ثورة في عالم التداول

ينتقل باحثون سابقون في DeepMind من هزيمة لاعبي البوكر المحترفين إلى إدارة مليارات الدولارات من حجم التداول في السوق. وقد حققت شركتهم الناشئة EquiLibre Technologies، التي تتخذ من براغ مقراً لها، تقييماً مذهلاً قدره 500 مليون دولار من خلال تطبيق التعلم المعزز (reinforcement learning) في عالم التمويل الكمي عالي المخاطر.

نقل استراتيجية البوكر إلى وول ستريت

يكمن الابتكار الجوهري الذي يقود EquiLibre في نقل التعلم المعزز (RL) من ألعاب المعلومات غير الكاملة إلى تعقيدات سوق الأسهم. وقد اكتسب الثلاثي المؤسس —الرئيس التنفيذي Martin Schmid، والمدير التقني Rudolf Kadlec، ومدير العلوم Matej Moravcik— شهرة واسعة سابقاً لتطويرهم DeepStack، وهو أول ذكاء اصطناعي يهزم لاعبي "تكساس هولدم" (Texas hold ’em) المحترفين بلا حدود.

هذا المنطق هو تطور طبيعي؛ فكل من البوكر والتداول يتطلبان اتخاذ قرارات مثالية في ظل عدم اليقين مع نتائج واضحة وقابلة للقياس. وكما يشير Schmid، فإن "تسجيل النقاط" في التداول بسيط للغاية، فالمكافأة النهائية هي الربح الرأسمالي. ومن خلال استخدام التعلم المعزز (RL)، حيث تتعلم النماذج عبر حلقات تغذية راجعة محفزة، تجاوزت EquiLibre حدود الألعاب لتنفيذ صفقات عبر مؤشري S&P 500 وNasdaq.

نطاق هائل وأداء مثبت

لا تكتفي EquiLibre بمجرد تشغيل عمليات المحاكاة، بل تشارك بنشاط في الأسواق العالمية. فبالشراكة مع شركة التمويل الكمي Tower Research Capital، تدير خوارزميات الشركة الناشئة مليارات الدولارات من حجم التداول اليومي.

ويتميز سجل الشركة الناشئة باستقرار ملحوظ. فبعد انطلاقتها الأولية في أسواق العملات المشفرة في عام 2025، توسعت الشركة في الأسهم التقليدية، مدعية امتلاكها "سجلاً مثالياً بخلوّها من أي أشهر سلبية منذ التأسيس". ويعد هذا المستوى من الاستقرار عامل جذب رئيسي لشركات رأس المال الاستثماري مثل Creandum، التي قادت مؤخراً جولة تمويل من الفئة (A) مثلت أكبر استثمار منفرد للشركة حتى الآن.

السباق نحو القدرات الحوسبية والمواهب

بينما نجحت EquiLibre في الوصول إلى تقييم قدره 500 مليون دولار، فإنها تواجه منافسة شديدة من عمالقة التداول الراسخين مثل Jane Street، التي تستخدم عشرات الآلاف من وحدات معالجة الرسومات (GPUs) المتطورة وتدمج التعلم المعزز (RL) مع النماذج اللغوية الكبيرة (LLMs).

وللمنافسة، تركز EquiLibre على نهج "المختبر أولاً" بدلاً من العقلية المالية التقليدية. وتتضمن استراتيجيتها ركيزتين أساسيتين:

  • الكفاءة بدلاً من القوة الغاشمة: بدلاً من الاعتماد على مجموعات ضخمة من وحدات معالجة الرسومات (GPU clusters)، يهدف الفريق إلى "تحقيق المزيد من القليل"، من خلال تحسين الخوارزميات لاستخراج أداء أعلى من قدرات حوسبية محدودة.
  • البنية التحتية الاستراتيجية: تخطط الشركة لبناء أحد أكبر مجموعات الحوسبة في وسط وشرق أوروبا (CEE) لتوسيع قدراتها البحثية.

ومن خلال اتخاذ براغ مقراً لها، استطاع المؤسسون أيضاً الاستفادة من الكفاءات التشيكية المتخصصة العاملة في شركات مثل Google، مما سمح لهم ببناء فريق رفيع المستوى يضم 25 خبيراً خارج النظام البيئي شديد التنافسية في سان فرانسيسكو.

النقاط الرئيسية

  • التطور الخوارزمي: تنجح EquiLibre في نقل تقنيات التعلم المعزز المستخدمة في البوكر الاحترافي (DeepStack) لإدارة مليارات الدولارات من حجم التداول اليومي في مؤشري S&P 500 وNasdaq.
  • تقييم انفجاري: بعد جولة تمويل ناجحة من الفئة (A) بقيادة Creandum، وصلت الشركة الناشئة إلى تقييم قدره 500 مليون دولار، مدفوعة بسجل حافل يُقال إنه "لم يشهد أي أشهر سلبية".
  • الكفاءة كخندق تنافسي: في مواجهة عمالقة يتمتعون بمزايا عتادية ضخمة، تركز EquiLibre على الكفاءة الخوارزمية وبناء بنية تحتية حوسبية كبيرة في منطقة وسط وشرق أوروبا (CEE).