Bagaimana General Intuition Menggunakan Permainan Video untuk Membina AI Dunia Nyata
General Intuition sedang cuba melakukan anjakan paradigma besar dalam bidang robotik dengan menggunakan set data permainan video yang besar untuk melatih model ejen bagi dunia fizikal. Dengan pusingan pendanaan baharu sebanyak $320 juta, syarikat pemula ini bertaruh bahawa "data tindakan" yang terdapat dalam permainan adalah pautan yang hilang bagi kecerdasan buatan.
Kuasa Label Tindakan dan Penaakulan Ruang-Masa
Walaupun ramai penyelidik AI cuba melatih model hanya dengan memerhati rakaman video, CEO General Intuition, Pim de Witte, berhujah bahawa video semata-mata tidak mencukupi. Kelebihan daya saing syarikat ini terletak pada aksesnya kepada data proprietari daripada Medal, sebuah platform di mana pengguna berkongsi klip permainan video.
Berbeza dengan video standard, klip ini mengandungi "label tindakan" yang terbenam—rekod tepat tentang butang mana yang ditekan oleh pemain dan bila ia ditekan. Ini membolehkan model tersebut melangkaui sekadar pengecaman corak; ia mempelajari penaakulan ruang-masa. Dengan memahami kaitan langsung antara input tertentu (suatu tindakan) dan perubahan yang terhasil dalam persekitaran (reaksi), AI mula memahami sebab dan akibat. Ini membolehkan model tersebut membezakan antara "diri" dengan "persekitaran," satu keperluan asas bagi mana-mana ejen autonomi.
Daripada Fortnite kepada Robot Berkaki Empat
Matlamat teknikal syarikat ini adalah untuk mencipta satu model tunggal yang boleh digeneralisasikan merentasi pelbagai domain: permainan, simulasi, dan perwujudan fizikal. Dalam demonstrasi baru-baru ini, seorang ejen AI yang dilatih melalui permainan mampu mengemudi persekitaran maya yang kompleks, memahami bahawa dinding adalah objek pepejal dan bayang-bayang berubah mengikut pergerakan matahari.
Yang paling penting, "otak" ini dipindahkan terus ke perkakasan. Syarikat tersebut telah menunjukkan sebuah robot berkaki empat yang menggunakan model yang sama yang menggerakkan ejen permainannya. Menariknya, pasukan itu melaporkan bahawa hanya lapan minit data robotik dunia nyata—yang dikumpul di jalanan sebenar—diperlukan untuk memperhalusi (fine-tune) model bagi navigasi robot tersebut. Ini menunjukkan bahawa kerja berat mempelajari fizik dan kesedaran ruang dilakukan di dalam "gimnasium" permainan video, menjadikan penggunaan di dunia nyata jauh lebih cekap.
Pertaruhan $2.3 Bilion pada Ejen Umum
Skala cita-cita ini dicerminkan dalam penilaian syarikat tersebut. General Intuition baru-baru ini mengumpul $320 juta dengan penilaian sebanyak $2.3 bilion, menjadikan jumlah pendanaan yang didedahkan sebanyak $454 juta. Pusingan tersebut diterajui oleh Khosla Ventures, dengan penyertaan besar daripada General Catalyst, Jeff Bezos, Eric Schmidt, serta penyelidik daripada Google DeepMind dan MIT.
Modal tersebut diperuntukkan untuk dua matlamat utama: meningkatkan kapasiti pengkomputeran melalui kerjasama dengan CoreWeave dan menjadikan API mereka lebih meluas tersedia menjelang akhir musim panas. Bagi pelabur seperti Vinod Khosla, matlamatnya bukan sekadar automasi yang lebih baik, tetapi kemunculan "intuisi AI"—keupayaan menyerupai manusia untuk mengemudi dunia melalui pemahaman, dan bukannya sekadar mengikut arahan yang diprogramkan.
Ringkasan Utama
- Latihan Berasaskan Tindakan: General Intuition menggunakan "label tindakan" tekanan butang daripada klip permainan untuk mengajar AI tentang sebab dan akibat, melangkaui had latihan yang hanya menggunakan video.
- Simulasi Boleh Skala: Dengan menggunakan permainan video sebagai "gimnasium," syarikat ini boleh melatih penaakulan ruang-masa yang kompleks tanpa kos besar untuk mengumpul data robotik dunia nyata.
- Sokongan Institusi yang Besar: Dengan penilaian $2.3 bilion dan sokongan daripada tokoh seperti Jeff Bezos dan Eric Schmidt, syarikat ini sedang meletakkan dirinya sebagai pemain asas dalam era model dunia.
