General Intuition ने वीडियो गेम डेटा को रियल-वर्ल्ड AI में बदलने के लिए $320M जुटाए

General Intuition का मानना है कि फिजिकल इंटेलिजेंस (physical intelligence) के रहस्य खिलाड़ियों द्वारा कैप्चर किए गए वीडियो गेम फुटेज के लाखों घंटों में छिपे हैं। गेमिंग से प्राप्त हाई-फिडेलिटी एक्शन डेटा का लाभ उठाकर, स्टार्टअप का लक्ष्य ऐसे एजेंटिक मॉडल (agentic models) बनाना है जो Fortnite जैसे वर्चुअल वातावरण से भौतिक क्वाड्रुपेडल रोबोट्स (quadrupedal robots) में निर्बाध रूप से परिवर्तित हो सकें।

शुद्ध वीडियो की तुलना में एक्शन लेबल्स की शक्ति

कई प्रतिस्पर्धियों के विपरीत, जो केवल वीडियो देखकर AI एजेंटों को प्रशिक्षित करने का प्रयास करते हैं, General Intuition अपने पूर्ववर्ती, Medal से विरासत में मिले एक प्रोप्रायटरी लाभ का उपयोग करता है। जबकि अधिकांश मॉडल केवल पिक्सेल से गतिविधियों का अनुमान लगाने की कोशिश करते हैं, General Intuition "एक्शन लेबल्स" (action labels) का लाभ उठाता है—यानी गेमप्ले क्लिप्स के साथ रिकॉर्ड किए गए सटीक बटन प्रेस और टाइमस्टैम्प।

यह अंतर स्पैटियल-टेम्पोरल रीजनिंग (spatial-temporal reasoning) विकसित करने के लिए महत्वपूर्ण है। यह जानकर कि मानव इनपुट ठीक से 3D स्पेस में एक विशिष्ट गतिविधि का परिणाम कैसे देता है, मॉडल कार्य-कारण संबंध (causality) सीखता है: कि एक क्रिया पर्यावरण को कैसे प्रभावित करती है। CEO Pim de Witte का तर्क है कि यह मॉडल को "स्वयं" (self) को "पर्यावरण" (environment) से अलग करने की अनुमति देता है, जो भौतिक दुनिया में काम करने के इरादे वाले किसी भी एजेंट के लिए एक मौलिक आवश्यकता है।

Fortnite सिमुलेशन से रोबोट एम्बॉडिमेंट तक

कंपनी का तकनीकी आर्किटेक्चर एक "वर्ल्ड मॉडल" (world model) पर आधारित है जो एक आंतरिक ट्रेनिंग जिम के रूप में कार्य करता है। पारंपरिक गेम इंजन पर निर्भर रहने के बजाय, मॉडल फ्रेम-दर-फ्रेम वातावरण तैयार करता है, जिससे एजेंट केवल दोहराव के माध्यम से भौतिकी-आधारित वास्तविकताओं—जैसे दीवारों की मजबूती या छाया की गति—को सीख सकते हैं।

इस प्रशिक्षण का व्यावहारिक अनुप्रयोग उनके हार्डवेयर डेमो में पहले से ही दिखाई दे रहा है। कंपनी ने वर्चुअल परिदृश्यों में नेविगेट करने के लिए उपयोग किए जाने वाले उसी "मस्तिष्क" को सफलतापूर्वक एक बड़े क्वाड्रुपेडल रोबोट में तैनात किया है। उल्लेखनीय रूप से, टीम ने बताया कि रोबोट के भौतिक नेविगेशन के लिए मॉडल को फाइन-ट्यून करने के लिए सार्वजनिक सड़कों पर एकत्र किए गए वास्तविक दुनिया के रोबोटिक्स डेटा के केवल आठ मिनट की आवश्यकता पड़ी। यह सुझाव देता है कि इंटेलिजेंस का मुख्य कार्य सिमुलेशन में किया जा रहा है, जिससे वास्तविक दुनिया में तैनाती काफी तेज और सस्ती हो जाती है।

$2.3 बिलियन का विशाल मूल्यांकन

इस महत्वाकांक्षा का पैमाना कंपनी की हालिया फंडिंग में झलकता है। General Intuition ने Khosla Ventures के नेतृत्व में एक राउंड में $320 मिलियन जुटाए, जिससे इसका कुल मूल्यांकन $2.3 बिलियन हो गया। निवेशक समूह टेक जगत की दिग्गज हस्तियों का एक पावरहाउस है, जिसमें Jeff Bezos, Eric Schmidt और Google DeepMind एवं MIT के शोधकर्ता शामिल हैं।

पूंजी को दो प्राथमिक उद्देश्यों के लिए निर्धारित किया गया है:

  • कंप्यूट को स्केल करना (Scaling Compute): CoreWeave के साथ साझेदारी के माध्यम से, कंपनी अपने मॉडल की अगली पीढ़ी के प्री-ट्रेनिंग पर ध्यान केंद्रित करेगी।
  • API एक्सेसिबिलिटी (API Accessibility): फंड का एक हिस्सा एक व्यापक API लॉन्च करने के लिए उपयोग किया जाएगा, जिससे संभावित रूप से डेवलपर्स को गर्मियों के अंत तक उनके एजेंटिक मॉडल का उपयोग करने की अनुमति मिल सकेगी।

जैसे-जैसे उद्योग लार्ज लैंग्वेज मॉडल्स (LLMs) के टेक्स्ट-हैवी युग से आगे बढ़ रहा है, General Intuition खुद को "वर्ल्ड मॉडल्स" के मोर्चे पर स्थापित कर रहा है—ऐसा AI जो न केवल दुनिया के बारे में बात करता है, बल्कि यह भी समझता है कि इसमें कैसे आगे बढ़ना है।

मुख्य बातें

  • एक्शन-संचालित प्रशिक्षण (Action-Driven Training): केवल वीडियो के बजाय मानव गेमप्ले "एक्शन लेबल्स" का उपयोग करके, मॉडल वीडियो-ओनली दृष्टिकोणों की तुलना में कार्य-कारण संबंध और स्पैटियल रीजनिंग को कहीं अधिक प्रभावी ढंग से सीखता है।
  • स्केलेबल सिमुलेशन (Scalable Simulation): स्टार्टअप एजेंटों को प्रशिक्षित करने के लिए वीडियो गेम का उपयोग एक "जिम" के रूप में करता है, जिससे भौतिक रोबोटों को नियंत्रित करने के लिए आवश्यक महंगे, वास्तविक दुनिया के डेटा की मात्रा में भारी कमी आती है।
  • रणनीतिक समर्थन (Strategic Backing): $2.3B के मूल्यांकन और Khosla Ventures और Jeff Bezos जैसे दिग्गजों के समर्थन के साथ, कंपनी सामान्यीकृत AI एजेंटों के लिए एक आधारभूत परत (foundational layer) बनने के लिए तैयार है।