Từ Poker đến Lợi nhuận: Cách các Cựu nhân viên DeepMind đang Cách mạng hóa Giao dịch
Các nhà nghiên cứu cũ của DeepMind đang chuyển hướng từ việc đánh bại các tay chơi poker chuyên nghiệp sang quản lý khối lượng giao dịch hàng tỷ đô la trên thị trường. Startup EquiLibre Technologies có trụ sở tại Prague của họ đã đạt được mức định giá đáng kinh ngạc là 500 triệu USD bằng cách áp dụng học tăng cường (reinforcement learning) vào thế giới tài chính định lượng đầy rủi ro.
Chuyển đổi Chiến thuật Poker sang Wall Street
Đổi mới cốt lõi thúc đẩy EquiLibre là sự chuyển đổi của học tăng cường (RL) từ các trò chơi thông tin không hoàn hảo sang sự phức tạp của thị trường chứng khoán. Bộ ba nhà sáng lập—CEO Martin Schmid, CTO Rudolf Kadlec và CSO Matej Moravcik—trước đây đã nổi tiếng với việc phát triển DeepStack, AI đầu tiên đánh bại các tay chơi Texas hold ’em không giới hạn (no-limit) chuyên nghiệp.
Logic này là một sự tiến hóa tự nhiên: cả poker và giao dịch đều liên quan đến việc đưa ra các quyết định tối ưu trong điều kiện không chắc chắn với các kết quả rõ ràng, có thể đo lường được. Như Schmid lưu ý, việc "tính điểm" trong giao dịch cực kỳ đơn giản—phần thưởng cuối cùng chính là lợi nhuận vốn. Bằng cách sử dụng RL, nơi các mô hình học thông qua các vòng lặp phản hồi có tính khuyến khích, EquiLibre đã vượt xa khỏi lĩnh vực trò chơi để thực hiện các giao dịch trên S&P 500 và Nasdaq.
Quy mô Khổng lồ và Hiệu suất đã được Chứng minh
EquiLibre không chỉ đơn thuần là chạy các mô phỏng; họ đang tích cực tham gia vào các thị trường toàn cầu. Thông qua quan hệ đối tác với công ty định lượng Tower Research Capital, các thuật toán của startup này đã và đang quản lý khối lượng giao dịch hàng tỷ đô la mỗi ngày.
Thành tích của startup này đặc biệt đáng chú ý bởi sự nhất quán. Sau đợt triển khai ban đầu tại thị trường tiền điện tử vào năm 2025, công ty đã mở rộng sang thị trường cổ phiếu truyền thống, khẳng định "kỷ lục hoàn hảo không có tháng thua lỗ nào kể từ khi thành lập." Mức độ ổn định này là một sức hút lớn đối với các nhà đầu tư mạo hiểm như Creandum, đơn vị gần đây đã dẫn đầu vòng gọi vốn Series A, đánh dấu khoản đầu tư đơn lẻ lớn nhất của họ cho đến nay.
Cuộc đua về Năng lực Tính toán và Tài năng
Mặc dù EquiLibre đã nâng quy mô thành công lên mức định giá 500 triệu USD, họ vẫn phải đối mặt với sự cạnh tranh gay gắt từ các gã khổng lồ giao dịch lâu đời như Jane Street, đơn vị sử dụng hàng chục nghìn GPU cao cấp và kết hợp RL với các Mô hình Ngôn ngữ Lớn (LLMs).
Để cạnh tranh, EquiLibre đang tập trung vào cách tiếp cận "ưu tiên phòng thí nghiệm" thay vì tư duy tài chính truyền thống. Chiến lược của họ bao gồm hai trụ cột chính:
- Hiệu quả thay vì Sức mạnh thô: Thay vì dựa vào các cụm GPU khổng lồ, đội ngũ đặt mục tiêu "đạt được nhiều hơn từ ít hơn", tối ưu hóa các thuật toán để khai thác hiệu suất cao hơn từ năng lực tính toán hạn chế.
- Cơ sở hạ tầng chiến lược: Công ty có kế hoạch xây dựng một trong những cụm tính toán lớn nhất ở Trung và Đông Âu (CEE) để mở rộng khả năng nghiên cứu của mình.
Bằng cách đặt trụ sở tại Prague, các nhà sáng lập cũng đã tận dụng được cộng đồng người Czech chuyên môn cao từ các công ty như Google, cho phép họ xây dựng một đội ngũ gồm 25 chuyên gia trình độ cao bên ngoài hệ sinh thái San Francisco cực kỳ cạnh tranh.
Các điểm chính cần lưu ý
- Sự tiến hóa của thuật toán: EquiLibre đang chuyển đổi thành công các kỹ thuật học tăng cường được sử dụng trong poker chuyên nghiệp (DeepStack) để quản lý khối lượng giao dịch hàng tỷ đô la hàng ngày trên S&P 500 và Nasdaq.
- Định giá bùng nổ: Sau vòng Series A thành công do Creandum dẫn đầu, startup đã đạt mức định giá 500 triệu USD, được thúc đẩy bởi thành tích được báo cáo là "không có tháng thua lỗ nào".
- Hiệu quả là lợi thế cạnh tranh: Đối mặt với các gã khổng lồ có lợi thế phần cứng khổng lồ, EquiLibre đang tập trung vào hiệu quả thuật toán và xây dựng cơ sở hạ tầng tính toán đáng kể tại khu vực CEE.
