Bagaimana General Intuition Menggunakan Video Game untuk Membangun AI Dunia Nyata

General Intuition sedang mencoba melakukan pergeseran paradigma besar-besaran dalam robotika dengan menggunakan dataset video game yang masif untuk melatih model agen bagi dunia fisik. Dengan putaran pendanaan baru senilai $320 juta, startup ini bertaruh bahwa "data aksi" yang ditemukan dalam permainan adalah mata rantai yang hilang bagi kecerdasan buatan.

Kekuatan Label Aksi dan Penalaran Spasial-Temporal

Meskipun banyak peneliti AI mencoba melatih model hanya dengan mengamati rekaman video, CEO General Intuition, Pim de Witte, berpendapat bahwa video saja tidak cukup. Keunggulan kompetitif perusahaan ini terletak pada aksesnya ke data kepemilikan dari Medal, sebuah platform tempat pengguna berbagi klip video game.

Berbeda dengan video standar, klip-klip ini berisi "label aksi" yang tertanam—catatan presisi tentang tombol mana yang ditekan pemain dan kapan tepatnya. Hal ini memungkinkan model untuk melampaui sekadar pengenalan pola; ia mempelajari penalaran spasial-temporal. Dengan memahami hubungan langsung antara input tertentu (sebuah aksi) dan perubahan yang dihasilkan pada lingkungan (reaksi), AI mulai memahami kausalitas. Ini memungkinkan model untuk membedakan antara "diri sendiri" dan "lingkungan," sebuah persyaratan mendasar bagi agen otonom apa pun.

Dari Fortnite hingga Robot Kuadruped

Ambisi teknis perusahaan ini adalah menciptakan satu model tunggal yang dapat digeneralisasi di berbagai domain: gameplay, simulasi, dan perwujudan fisik. Dalam demonstrasi terbaru, seorang agen AI yang dilatih pada gameplay mampu menavigasi lingkungan virtual yang kompleks, memahami bahwa dinding adalah objek padat dan bayangan berubah seiring pergerakan matahari.

Yang terpenting, "otak" ini dipindahkan langsung ke perangkat keras. Perusahaan tersebut mendemonstrasikan robot kuadrupedal yang menggunakan model yang sama dengan yang menggerakkan agen gaming mereka. Khususnya, tim melaporkan bahwa hanya dibutuhkan delapan menit data robotika dunia nyata—yang dikumpulkan di jalanan sebenarnya—untuk melakukan fine-tuning pada model untuk navigasi robot tersebut. Hal ini menunjukkan bahwa tugas berat dalam mempelajari fisika dan kesadaran spasial dilakukan di dalam "gym" video game, sehingga penerapan di dunia nyata menjadi jauh lebih efisien.

Taruhan Senilai $2,3 Miliar pada Agen Umum

Skala ambisi ini tercermin dalam valuasi perusahaan. General Intuition baru-baru ini mengumpulkan $320 juta dengan valuasi $2,3 miliar, sehingga total pendanaan yang diungkapkan menjadi $454 juta. Putaran ini dipimpin oleh Khosla Ventures, dengan partisipasi signifikan dari General Catalyst, Jeff Bezos, Eric Schmidt, serta peneliti dari Google DeepMind dan MIT.

Modal tersebut dialokasikan untuk dua tujuan utama: meningkatkan kapasitas komputasi melalui kemitraan dengan CoreWeave dan membuat API mereka tersedia secara lebih luas pada akhir musim panas. Bagi investor seperti Vinod Khosla, tujuannya bukan sekadar otomatisasi yang lebih baik, melainkan munculnya "intuisi AI"—kemampuan menyerupai manusia untuk menavigasi dunia melalui pemahaman, bukan sekadar mengikuti instruksi yang diprogram.

Poin-Poin Penting

  • Pelatihan Berbasis Aksi: General Intuition menggunakan "label aksi" penekanan tombol dari klip game untuk mengajarkan kausalitas pada AI, melampaui keterbatasan pelatihan yang hanya menggunakan video.
  • Simulasi yang Dapat Diskalakan: Dengan menggunakan video game sebagai "gym", perusahaan dapat melatih penalaran spasial-temporal yang kompleks tanpa biaya besar untuk mengumpulkan data robotika dunia nyata.
  • Dukungan Institusional yang Masif: Dengan valuasi $2,3 miliar dan dukungan dari tokoh-tokoh seperti Jeff Bezos dan Eric Schmidt, perusahaan ini memposisikan dirinya sebagai pemain fundamental dalam era model dunia.