General Intuition Raih Pendanaan $320 Juta untuk Mengubah Data Video Game Menjadi AI Dunia Nyata

General Intuition bertaruh bahwa rahasia kecerdasan fisik terletak pada jutaan jam rekaman video game yang ditangkap oleh para pemain. Dengan memanfaatkan data aksi beresolusi tinggi dari gaming, startup ini bertujuan untuk membangun model agen yang dapat bertransisi secara mulus dari lingkungan virtual seperti Fortnite ke robot berkaki empat fisik.

Kekuatan Label Aksi Dibandingkan Video Murni

Berbeda dengan banyak kompetitor yang mencoba melatih agen AI hanya dengan mengamati video, General Intuition memanfaatkan keunggulan kepemilikan yang diwarisi dari pendahulunya, Medal. Sementara sebagian besar model mencoba menyimpulkan gerakan hanya dari piksel, General Intuition memanfaatkan "label aksi"—tekanan tombol dan stempel waktu (timestamp) yang tepat yang direkam bersamaan dengan klip gameplay.

Perbedaan ini sangat penting untuk mengembangkan penalaran spasial-temporal. Dengan mengetahui secara pasti bagaimana input manusia menghasilkan gerakan tertentu dalam ruang 3D, model tersebut mempelajari kausalitas: bagaimana sebuah aksi memengaruhi lingkungan. CEO Pim de Witte berpendapat bahwa hal ini memungkinkan model untuk membedakan antara "diri sendiri" dan "lingkungan," sebuah persyaratan mendasar bagi agen apa pun yang ditujukan untuk beroperasi di dunia fisik.

Dari Simulasi Fortnite ke Perwujudan Robot

Arsitektur teknis perusahaan ini bertumpu pada "world model" yang berfungsi sebagai tempat latihan (training gym) internal. Alih-alih mengandalkan mesin game tradisional, model ini menghasilkan lingkungan bingkai demi bingkai (frame-by-frame), memungkinkan agen untuk mempelajari realitas berbasis fisika—seperti kekokohan dinding atau pergerakan bayangan—melalui pengulangan semata.

Penerapan praktis dari pelatihan ini sudah terlihat dalam demo perangkat keras mereka. Perusahaan telah berhasil menerapkan "otak" yang sama yang digunakan untuk menavigasi lanskap virtual ke dalam robot berkaki empat yang besar. Luar biasanya, tim melaporkan bahwa hanya dibutuhkan delapan menit data robotika dunia nyata, yang dikumpulkan di jalan umum, untuk melakukan fine-tuning pada model tersebut demi navigasi fisik robot. Hal ini menunjukkan bahwa proses berat dalam membangun kecerdasan dilakukan dalam simulasi, sehingga penerapan di dunia nyata menjadi jauh lebih cepat dan murah.

Valuasi Masif Sebesar $2,3 Miliar

Skala ambisi ini tercermin dalam pendanaan terbaru perusahaan. General Intuition mengumpulkan $320 juta dalam putaran yang dipimpin oleh Khosla Ventures, yang membawa total valuasinya menjadi $2,3 miliar. Kelompok investor ini merupakan kekuatan besar di dunia teknologi, termasuk Jeff Bezos, Eric Schmidt, serta para peneliti dari Google DeepMind dan MIT.

Modal tersebut dialokasikan untuk dua tujuan utama:

  • Penskalaan Komputasi: Melalui kemitraan dengan CoreWeave, perusahaan akan fokus pada pre-training generasi model berikutnya.
  • Aksesibilitas API: Sebagian dana akan digunakan untuk meluncurkan API yang lebih luas, yang berpotensi memungkinkan pengembang untuk memanfaatkan model agen mereka pada akhir musim panas ini.

Seiring industri bergerak melampaui era Large Language Models (LLM) yang padat teks, General Intuition memposisikan dirinya di garis depan "world models"—AI yang tidak hanya berbicara tentang dunia, tetapi memahami cara bergerak melaluinya.

Poin-Poin Penting

  • Pelatihan Berbasis Aksi: Dengan menggunakan "label aksi" gameplay manusia alih-alih hanya video, model ini mempelajari kausalitas dan penalaran spasial jauh lebih efektif daripada pendekatan yang hanya menggunakan video.
  • Simulasi yang Dapat Diskalakan: Startup ini menggunakan video game sebagai "gym" untuk melatih agen, sehingga secara drastis mengurangi jumlah data dunia nyata yang mahal yang diperlukan untuk mengendalikan robot fisik.
  • Dukungan Strategis: Dengan valuasi $2,3 miliar dan dukungan dari tokoh besar seperti Khosla Ventures dan Jeff Bezos, perusahaan ini diposisikan untuk menjadi lapisan fundamental bagi agen AI umum.