வீடியோ கேம் தரவை நிஜ உலக AI ஆக மாற்ற General Intuition $320M நிதியுதவி பெறுகிறது
இயற்பியல் நுண்ணறிவின் (physical intelligence) ரகசியங்கள், வீரர்களால் பதிவு செய்யப்பட்ட மில்லியன் கணக்கான மணிநேர வீடியோ கேம் காட்சிகளில் உள்ளன என்று General Intuition நம்புகிறது. கேமிங்கிலிருந்து பெறப்படும் உயர்தர செயல் தரவுகளைப் (high-fidelity action data) பயன்படுத்துவதன் மூலம், Fortnite போன்ற மெய்நிகர் சூழல்களிலிருந்து (virtual environments) இயற்பியல் நான்கு கால்களுள்ள ரோபோக்களுக்கு (quadrupedal robots) தடையின்றி மாறக்கூடிய ஏஜென்டிக் மாடல்களை (agentic models) உருவாக்குவதை இந்த ஸ்டார்ட்அப் நோக்கமாகக் கொண்டுள்ளது.
வெறும் வீடியோவை விட 'ஆக்சன் லேபிள்களின்' (Action Labels) வலிமை
வீடியோவை மட்டும் கவனிப்பதன் மூலம் AI ஏஜென்ட்களைப் பயிற்றுவிக்க முயற்சிக்கும் பல போட்டியாளர்களைப் போலல்லாமல், General Intuition தனது முன்னோடியான Medal மூலம் பெற்ற ஒரு தனித்துவமான நன்மையைப் பயன்படுத்துகிறது. பெரும்பாலான மாடல்கள் பிக்சல்களை (pixels) மட்டுமே வைத்து இயக்கங்களைக் கணிக்க முயலும் போது, General Intuition "ஆக்சன் லேபிள்களை" (action labels) பயன்படுத்துகிறது—அதாவது கேம்ப்ளே கிளிப்களுடன் சேர்த்துப் பதிவு செய்யப்பட்ட துல்லியமான பட்டன் அழுத்தங்கள் மற்றும் நேர முத்திரைகள் (timestamps).
இடஞ்சார்ந்த-கால ரீதியான பகுத்தறிவை (spatial-temporal reasoning) மேம்படுத்துவதற்கு இந்த வேறுபாடு மிகவும் முக்கியமானது. ஒரு மனிதனின் உள்ளீடு (input) எவ்வாறு 3D வெளியில் ஒரு குறிப்பிட்ட இயக்கத்திற்கு வழிவகுக்கிறது என்பதைத் துல்லியமாக அறிந்துகொள்வதன் மூலம், அந்த மாடல் காரண-காரியத் தொடர்பைக் (causality) கற்றுக்கொள்கிறது: அதாவது ஒரு செயல் எவ்வாறு சூழலை பாதிக்கிறது என்பதை அறியும். இயற்பியல் உலகில் செயல்படத் திட்டமிடப்பட்டுள்ள எந்தவொரு ஏஜென்ட்டிற்கும் அவசியமான ஒன்று, "தன்னை" (self) மற்றும் "சூழலை" (environment) வேறுபடுத்திப் பார்ப்பது; இது இந்த மாடலுக்குச் சாத்தியமாகிறது என்று CEO Pim de Witte வாதிடுகிறார்.
Fortnite உருவகப்படுத்துதலில் (Simulation) இருந்து ரோபோ உருவாவதற்கு
நிறுவனத்தின் தொழில்நுட்பக் கட்டமைப்பு, ஒரு உள் பயிற்சி கூடமாக (internal training gym) செயல்படும் "வேர்ல்ட் மாடல்" (world model) என்பதன் அடிப்படையில் அமைந்துள்ளது. பாரம்பரிய கேம் என்ஜின்களைச் (game engines) சார்ந்திருப்பதற்குப் பதிலாக, இந்த மாடல் ஒவ்வொரு பிரேம்களாக (frame-by-frame) சூழல்களை உருவாக்குகிறது. இதன் மூலம் ஏஜென்ட்கள் சுவர்களின் உறுதித்தன்மை அல்லது நிழல்களின் இயக்கம் போன்ற இயற்பியல் சார்ந்த யதார்த்தங்களைத் தொடர்ச்சியான பயிற்சியின் மூலம் கற்றுக்கொள்ள முடிகிறது.
இந்த பயிற்சியின் நடைமுறைப் பயன்பாடு அவர்களின் வன்பொருள் டெமோக்களில் (hardware demos) ஏற்கனவே காணப்படுகிறது. மெய்நிகர் நிலப்பரப்புகளை வழிநடத்தப் பயன்படுத்தப்பட்ட அதே "மூளையை" (brain), ஒரு பெரிய நான்கு கால்களுள்ள ரோபோவில் நிறுவனம் வெற்றிகரமாகப் பொருத்தியுள்ளது. வியக்கத்தக்க வகையில், பொதுச் சாலைகளில் சேகரிக்கப்பட்ட வெறும் எட்டு நிமிட நிஜ உலக ரோபோடிக்ஸ் தரவுகளைக் கொண்டே, ரோபோவின் இயற்பியல் வழிசெலுத்தலுக்கு (physical navigation) மாடலைச் செம்மைப்படுத்த (fine-tune) முடிந்தது என்று குழுவினர் தெரிவித்துள்ளனர். இது நுண்ணறிவின் பெரும்பகுதி உருவகப்படுத்துதலில் (simulation) செய்யப்படுவதைக் காட்டுகிறது, இதனால் நிஜ உலகில் செயல்படுத்துவது கணிசமாக வேகமாகவும் மலிவாகவும் மாறுகிறது.
ஒரு பிரம்மாண்டமான $2.3 பில்லியன் மதிப்பீடு
இந்த லட்சியத்தின் அளவு நிறுவனத்தின் சமீபத்திய நிதிப்பரிமாற்றத்தில் பிரதிபலிக்கிறது. Khosla Ventures தலைமையிலான நிதிச் சுற்றில் General Intuition $320 மில்லியன் நிதியுதவி பெற்றுள்ளது, இது அதன் மொத்த மதிப்பீட்டை $2.3 பில்லியனாக உயர்த்தியுள்ளது. இந்த முதலீட்டாளர் குழுவில் Jeff Bezos, Eric Schmidt மற்றும் Google DeepMind மற்றும் MIT ஆராய்ச்சியாளர்கள் உள்ளிட்ட தொழில்நுட்ப உலகின் முக்கியப் பிரபலங்கள் உள்ளனர்.
இந்த மூலதனம் இரண்டு முக்கிய நோக்கங்களுக்காக ஒதுக்கப்பட்டுள்ளது:
- கணினித் திறனை அதிகரித்தல் (Scaling Compute): CoreWeave உடனான கூட்டாண்மை மூலம், நிறுவனம் தனது அடுத்த தலைமுறை மாடலை முன்-பயிற்சி (pre-training) செய்வதில் கவனம் செலுத்தும்.
- API அணுகல் (API Accessibility): நிதியின் ஒரு பகுதி விரிவான API-ஐத் தொடங்குவதற்குப் பயன்படுத்தப்படும், இது கோடைக்காலத்தின் இறுதிக்குள் டெவலப்பர்கள் அவர்களின் ஏஜென்டிக் மாடல்களைப் பயன்படுத்த வழிவகுக்கக்கூடும்.
தொழில்துறை, உரையை அடிப்படையாகக் கொண்ட Large Language Models (LLMs) யுகத்தைத் தாண்டி நகரும் போது, General Intuition தன்னை "வேர்ல்ட் மாடல்களின்" (world models) முன்னணியில் நிலைநிறுத்திக் கொள்கிறது—அதாவது உலகத்தைப் பற்றிப் பேசுவது மட்டுமல்லாமல், அதன் வழியாக எவ்வாறு நகர்வது என்பதையும் புரிந்து கொள்ளும் AI.
முக்கியக் குறிப்புகள்
- செயல் சார்ந்த பயிற்சி (Action-Driven Training): வெறும் வீடியோவை மட்டும் பயன்படுத்தாமல், மனித கேம்ப்ளே "ஆக்சன் லேபிள்களைப்" பயன்படுத்துவதன் மூலம், வீடியோ-சார்ந்த அணுகுமுறைகளை விட இந்த மாடல் காரண-காரியத் தொடர்பையும் இடஞ்சார்ந்த பகுத்தறிவையும் மிகவும் திறம்படக் கற்றுக்கொள்கிறது.
- அளவிடக்கூடிய உருவகப்படுத்துதல் (Scalable Simulation): இந்த ஸ்டார்ட்அப் ஏஜென்ட்களைப் பயிற்றுவிக்க வீடியோ கேம்களை ஒரு "ஜிம்" போலப் பயன்படுத்துகிறது, இது இயற்பியல் ரோபோக்களைக் கட்டுப்படுத்தத் தேவைப்படும் விலையுயர்ந்த, நிஜ உலகத் தரவுகளின் அளவை பெருமளவு குறைக்கிறது.
- மூலோபாய ஆதரவு (Strategic Backing): $2.3 பில்லியன் மதிப்பீடு மற்றும் Khosla Ventures மற்றும் Jeff Bezos போன்ற பெரும் நிறுவனங்களின் ஆதரவுடன், பொதுவான AI ஏஜென்ட்களுக்கான ஒரு அடிப்படை அடுக்காக (foundational layer) மாற இந்த நிறுவனம் தயாராக உள்ளது.
