General Intuition huy động 320 triệu USD để biến dữ liệu trò chơi điện tử thành AI thế giới thực

General Intuition đang đặt cược rằng bí mật của trí tuệ vật lý nằm trong hàng triệu giờ quay phim trò chơi điện tử do người chơi ghi lại. Bằng cách tận dụng dữ liệu hành động độ trung thực cao từ trò chơi, startup này đặt mục tiêu xây dựng các mô hình tác nhân (agentic models) có thể chuyển đổi liền mạch từ môi trường ảo như Fortnite sang các robot bốn chân vật lý.

Sức mạnh của Nhãn hành động so với Video thuần túy

Khác với nhiều đối thủ cạnh tranh cố gắng huấn luyện các tác nhân AI chỉ bằng cách quan sát video, General Intuition tận dụng lợi thế độc quyền kế thừa từ tiền thân của mình là Medal. Trong khi hầu hết các mô hình cố gắng suy luận chuyển động chỉ từ các điểm ảnh (pixels), General Intuition lại tận dụng "nhãn hành động" (action labels)—chính là các lần nhấn nút và mốc thời gian chính xác được ghi lại cùng với các đoạn clip chơi game.

Sự khác biệt này đóng vai trò then chốt trong việc phát triển khả năng lập luận không gian - thời gian. Bằng cách biết chính xác một thao tác của con người dẫn đến một chuyển động cụ thể trong không gian 3D như thế nào, mô hình sẽ học được tính nhân quả: cách một hành động tác động đến môi trường. CEO Pim de Witte lập luận rằng điều này cho phép mô hình phân biệt được "bản thân" (self) với "môi trường" (environment), một yêu cầu cơ bản đối với bất kỳ tác nhân nào dự định hoạt động trong thế giới vật lý.

Từ mô phỏng Fortnite đến hiện thực hóa vào Robot

Kiến trúc kỹ thuật của công ty dựa trên một "mô hình thế giới" (world model) hoạt động như một phòng tập huấn luyện nội bộ. Thay vì dựa vào các công cụ phát triển trò chơi (game engine) truyền thống, mô hình này tạo ra các môi trường theo từng khung hình, cho phép các tác nhân học hỏi các thực tế dựa trên vật lý—chẳng hạn như độ cứng của các bức tường hay sự chuyển động của bóng đổ—thông qua việc lặp đi lặp lại.

Ứng dụng thực tế của quá trình huấn luyện này đã có thể thấy rõ qua các bản demo phần cứng của họ. Công ty đã triển khai thành công cùng một "bộ não" vốn được dùng để điều hướng trong các cảnh quan ảo vào một robot bốn chân lớn. Đáng chú ý, nhóm nghiên cứu báo cáo rằng chỉ mất tám phút dữ liệu robot thực tế, được thu thập trên các đường phố công cộng, để tinh chỉnh (fine-tune) mô hình cho việc điều hướng vật lý của robot. Điều này cho thấy phần lớn công việc nặng nhọc của trí tuệ đang được thực hiện trong môi trường mô phỏng, giúp việc triển khai thực tế trở nên nhanh hơn và rẻ hơn đáng kể.

Định giá khổng lồ 2,3 tỷ USD

Quy mô của tham vọng này được phản ánh qua đợt huy động vốn gần đây của công ty. General Intuition đã huy động được 320 triệu USD trong một vòng gọi vốn do Khosla Ventures dẫn đầu, nâng tổng định giá của công ty lên 2,3 tỷ USD. Nhóm nhà đầu tư là tập hợp của những tên tuổi lớn trong giới công nghệ, bao gồm Jeff Bezos, Eric Schmidt, cùng các nhà nghiên cứu từ Google DeepMind và MIT.

Nguồn vốn này được dành riêng cho hai mục tiêu chính:

  • Mở rộng năng lực tính toán: Thông qua quan hệ đối tác với CoreWeave, công ty sẽ tập trung vào việc tiền huấn luyện (pre-training) thế hệ mô hình tiếp theo.
  • Khả năng tiếp cận API: Một phần kinh phí sẽ được sử dụng để ra mắt một API rộng rãi hơn, có khả năng cho phép các nhà phát triển khai thác các mô hình tác nhân của họ vào cuối mùa hè này.

Khi ngành công nghiệp vượt qua kỷ nguyên thiên về văn bản của các Mô hình Ngôn ngữ Lớn (LLMs), General Intuition đang định vị mình ở vị trí tiên phong của các "mô hình thế giới"—loại AI không chỉ nói về thế giới, mà còn hiểu cách di chuyển trong đó.

Các điểm chính cần lưu ý

  • Huấn luyện dựa trên hành động: Bằng cách sử dụng "nhãn hành động" từ lối chơi của con người thay vì chỉ dùng video, mô hình học được tính nhân quả và lập luận không gian hiệu quả hơn nhiều so với các phương pháp chỉ dựa trên video.
  • Mô phỏng có khả năng mở rộng: Startup này sử dụng trò chơi điện tử như một "phòng tập" để huấn luyện các tác nhân, giúp giảm đáng kể lượng dữ liệu thực tế đắt đỏ cần thiết để điều khiển các robot vật lý.
  • Sự hậu thuẫn chiến lược: Với mức định giá 2,3 tỷ USD và sự hỗ trợ từ những tên tuổi lớn như Khosla Ventures và Jeff Bezos, công ty đang ở vị thế sẵn sàng trở thành một lớp nền tảng cho các tác nhân AI tổng quát.