व्हिडिओ गेम डेटाचे खऱ्या जगातील AI मध्ये रूपांतर करण्यासाठी General Intuition ने $320M उभारले
General Intuition असा विश्वास ठेवत आहे की भौतिक बुद्धिमत्तेची (physical intelligence) गुपिते खेळाडूंनी रेकॉर्ड केलेल्या लाखो तासांच्या व्हिडिओ गेम फुटेजमध्ये दडलेली आहेत. गेमिंगमधील उच्च-गुणवत्तेच्या (high-fidelity) 'ॲक्शन डेटा'चा वापर करून, हे स्टार्टअप असे 'एजेंटिक मॉडेल्स' (agentic models) तयार करण्याचे उद्दिष्ट ठेवत आहे, जे Fortnite सारख्या आभासी वातावरणातून थेट प्रत्यक्ष चार पायांच्या रोबोट्समध्ये (quadrupedal robots) सहजपणे रूपांतरित होऊ शकतील.
केवळ व्हिडिओपेक्षा 'ॲक्शन लेबल्स'ची ताकद
केवळ व्हिडिओ पाहून AI एजंट्सना प्रशिक्षित करण्याचा प्रयत्न करणाऱ्या अनेक स्पर्धकांपेक्षा वेगळे, General Intuition आपल्या पूर्ववर्ती कंपनी Medal कडून मिळालेल्या खास तंत्राचा (proprietary advantage) वापर करते. बहुतेक मॉडेल्स केवळ पिक्सेलवरून हालचालींचा अंदाज घेण्याचा प्रयत्न करतात, परंतु General Intuition "ॲक्शन लेबल्स"चा (action labels) वापर करते—म्हणजेच गेमप्ले क्लिप्ससोबत रेकॉर्ड केलेले नेमके बटण दाबणे आणि वेळेच्या नोंदी (timestamps).
स्पेसियल-टेम्पोरल रिझनिंग (spatial-temporal reasoning) विकसित करण्यासाठी हा फरक अत्यंत महत्त्वाचा आहे. मानवी इनपुटमुळे 3D स्पेसमध्ये नेमकी कोणती हालचाल होते हे समजल्यामुळे, मॉडेलला 'कारणात्मकता' (causality) शिकता येते: म्हणजेच एखादी कृती पर्यावरणावर कसा परिणाम करते. CEO Pim de Witte यांच्या मते, यामुळे मॉडेलला "स्वतःमध्ये" आणि "पर्यावरणात" फरक करणे शक्य होते, जे प्रत्यक्ष जगात काम करणाऱ्या कोणत्याही एजंटसाठी मूलभूत आवश्यकतेचे आहे.
Fortnite सिम्युलेशनपासून रोबोटिक अंमलबजावणीपर्यंत
कंपनीचे तांत्रिक आर्किटेक्चर एका "वर्ल्ड मॉडेल"वर (world model) आधारित आहे, जे अंतर्गत प्रशिक्षण जिम (training gym) म्हणून काम करते. पारंपारिक गेम इंजिनवर अवलंबून राहण्याऐवजी, हे मॉडेल फ्रेम-बाय-फ्रेम वातावरण तयार करते, ज्यामुळे एजंट्सना केवळ पुनरावृत्तीद्वारे भौतिक वास्तव—जसे की भिंतींची मजबुती किंवा सावल्यांची हालचाल—शिकता येते.
या प्रशिक्षणाचा व्यावहारिक वापर त्यांच्या हार्डवेअर डेमोमध्ये आधीच दिसून येत आहे. आभासी प्रदेशात नेव्हिगेट करण्यासाठी वापरले जाणारे तेच "मेंदू" कंपनीने एका मोठ्या चार पायांच्या रोबोटमध्ये यशस्वीरित्या तैनात केले आहे. विशेष म्हणजे, टीमने असे सांगितले की, रोबोटच्या प्रत्यक्ष नेव्हिगेशनसाठी मॉडेलला 'फाईन-ट्यून' करण्यासाठी सार्वजनिक रस्त्यांवरील केवळ आठ मिनिटांचा प्रत्यक्ष रोबोटिक्स डेटा पुरेसा ठरला. यावरून असे सूचित होते की, बुद्धिमत्तेचे मुख्य काम सिम्युलेशनमध्ये केले जात आहे, ज्यामुळे प्रत्यक्ष जगात रोबोट तैनात करणे लक्षणीयरीत्या जलद आणि स्वस्त होते.
$2.3 अब्ज मूल्यांकन
या महत्त्वाकांक्षेचे प्रमाण कंपनीच्या अलीकडील निधीतून दिसून येते. Khosla Ventures च्या नेतृत्वाखालील राउंडमध्ये General Intuition ने $320 दशलक्ष उभारले आहेत, ज्यामुळे कंपनीचे एकूण मूल्यांकन $2.3 अब्ज झाले आहे. या गुंतवणूकदार गटात Jeff Bezos, Eric Schmidt आणि Google DeepMind आणि MIT मधील संशोधकांसह तंत्रज्ञान क्षेत्रातील दिग्गज व्यक्तींचा समावेश आहे.
हा निधी दोन मुख्य उद्दिष्टांसाठी राखून ठेवण्यात आला आहे:
- कम्प्युट स्केल करणे (Scaling Compute): CoreWeave सोबतच्या भागीदारीद्वारे, कंपनी आपल्या मॉडेलच्या पुढच्या पिढीच्या प्री-ट्रेनिंगवर लक्ष केंद्रित करेल.
- API उपलब्धता (API Accessibility): निधीचा एक भाग व्यापक API लाँच करण्यासाठी वापरला जाईल, ज्यामुळे उन्हाळ्याच्या अखेरीस डेव्हलपर्सना त्यांच्या एजेंटिक मॉडेल्सचा वापर करण्याची संधी मिळू शकते.
उद्योग जसा Large Language Models (LLMs) च्या केवळ मजकूर-आधारित युगाच्या पलीकडे जात आहे, तसे General Intuition स्वतःला "वर्ल्ड मॉडेल्स"च्या (world models) आघाडीवर स्थान देत आहे—असे AI जे केवळ जगाबद्दल बोलत नाही, तर त्यामध्ये कसे फिरायचे किंवा हालचाल करायची हे समजून घेते.
मुख्य मुद्दे
- ॲक्शन-आधारित प्रशिक्षण: केवळ व्हिडिओऐवजी मानवी गेमप्ले "ॲक्शन लेबल्स" वापरल्यामुळे, मॉडेल केवळ व्हिडिओवर आधारित पद्धतींपेक्षा कारणात्मकता आणि स्पेसियल रिझनिंग अधिक प्रभावीपणे शिकते.
- स्केलेबल सिम्युलेशन: हे स्टार्टअप एजंट्सना प्रशिक्षित करण्यासाठी व्हिडिओ गेम्सचा "जिम" म्हणून वापर करते, ज्यामुळे प्रत्यक्ष रोबोट्स नियंत्रित करण्यासाठी लागणाऱ्या महागड्या, वास्तविक जगातील डेटाचे प्रमाण मोठ्या प्रमाणात कमी होते.
- धोरणात्मक पाठबळ: $2.3 अब्ज मूल्यांकन आणि Khosla Ventures आणि Jeff Bezos सारख्या दिग्गज व्यक्तींच्या पाठबळामुळे, ही कंपनी सामान्यीकृत AI एजंट्ससाठी एक पायाभूत स्तर (foundational layer) बनण्याच्या तयारीत आहे.
