వీడియో గేమ్ డేటాను రియల్-వరల్డ్ AIగా మార్చడానికి General Intuition $320M సేకరించింది

భౌతిక మేధస్సు (physical intelligence) యొక్క రహస్యాలు ఆటగాళ్లు చిత్రీకరించిన మిలియన్ల గంటల వీడియో గేమ్ ఫుటేజీలో ఉన్నాయని General Intuition నమ్ముతోంది. గేమింగ్ నుండి లభించే హై-ఫిడెలిటీ యాక్షన్ డేటాను ఉపయోగించుకోవడం ద్వారా, Fortnite వంటి వర్చువల్ వాతావరణాల నుండి భౌతిక క్వాడ్రూపెడల్ (నాలుగు కాళ్లు కలిగిన) రోబోట్‌లకు సజావుగా మారగలిగే ఏజెంటిక్ మోడల్స్‌ను నిర్మించాలని ఈ స్టార్టప్ లక్ష్యంగా పెట్టుకుంది.

కేవలం వీడియో కంటే యాక్షన్ లేబుల్స్ యొక్క శక్తి

కేవలం వీడియోలను గమనించడం ద్వారా AI ఏజెంట్‌లను శిక్షణ ఇవ్వడానికి ప్రయత్నించే అనేక ప్రత్యర్థులలా కాకుండా, General Intuition తన పూర్వ సంస్థ Medal నుండి వారసత్వంగా వచ్చిన ప్రత్యేక ప్రయోజనాన్ని ఉపయోగిస్తుంది. చాలా మోడల్స్ కేవలం పిక్సెల్స్ నుండి కదలికలను అంచనా వేయడానికి ప్రయత్నిస్తుంటే, General Intuition "action labels"ను ఉపయోగిస్తుంది—అంటే గేమ్‌ప్లే క్లిప్‌లతో పాటు రికార్డ్ చేయబడిన ఖచ్చితమైన బటన్ ప్రెస్‌లు మరియు టైమ్‌స్టాంప్‌లు.

స్పేషియల్-టెంపోరల్ రీజనింగ్ (spatial-temporal reasoning) అభివృద్ధి చేయడానికి ఈ వ్యత్యాసం చాలా కీలకం. ఒక మానవ ఇన్‌పుట్ 3D స్పేస్‌లో ఒక నిర్దిష్ట కదలికకు ఎలా దారితీస్తుందో ఖచ్చితంగా తెలుసుకోవడం ద్వారా, మోడల్ కారణకతను (causality) నేర్చుకుంటుంది: అంటే ఒక చర్య పర్యావరణాన్ని ఎలా ప్రభావితం చేస్తుంది అనేది. భౌతిక ప్రపంచంలో పనిచేయాలని ఉద్దేశించిన ఏ ఏజెంట్‌కైనా "స్వయం" (self) మరియు "పర్యావరణం" (environment) మధ్య తేడాను గుర్తించడం ప్రాథమిక అవసరం అని CEO Pim de Witte వాదిస్తున్నారు.

Fortnite సిమ్యులేషన్ నుండి రోబోట్ ఎంబోడీమెంట్ వరకు

కంపెనీ యొక్క సాంకేతిక నిర్మాణం అంతర్గత శిక్షణ జిమ్ (training gym) వలె పనిచేసే "world model" పై ఆధారపడి ఉంటుంది. సాంప్రదాయ గేమ్ ఇంజన్‌లపై ఆధారపడటానికి బదులుగా, ఈ మోడల్ ఫ్రేమ్-బై-ఫ్రేమ్ వాతావరణాలను సృష్టిస్తుంది, దీనివల్ల ఏజెంట్‌లు నిరంతర పునరావృతంలో భౌతిక ఆధారిత వాస్తవాలను—గోడల దృఢత్వం లేదా నీడల కదలిక వంటివి—నేర్చుకోగలుగుతాయి.

ఈ శిక్షణ యొక్క ఆచరణాత్మక అనువర్తనం ఇప్పటికే వారి హార్డ్‌వేర్ డెమోలలో కనిపిస్తోంది. వర్చువల్ ల్యాండ్‌స్కేప్‌లను నావిగేట్ చేయడానికి ఉపయోగించిన అదే "మెదడు"ను కంపెనీ ఒక పెద్ద క్వాడ్రూపెడల్ రోబోట్‌లో విజయవంతంగా అమర్చింది. విశేషమేమిటంటే, రోబోట్ యొక్క భౌతిక నావిగేషన్ కోసం మోడల్‌ను ఫైన్-ట్యూన్ చేయడానికి, బహిరంగ వీధుల్లో సేకరించిన కేవలం ఎనిమిది నిమిషాల రియల్-వరల్డ్ రోబోటిక్స్ డేటా మాత్రమే సరిపోయిందని బృందం తెలిపింది. దీని అర్థం మేధస్సు యొక్క ప్రధాన పని సిమ్యులేషన్‌లోనే జరుగుతోంది, తద్వారా రియల్-వరల్డ్ డిప్లాయ్‌మెంట్ గణనీయంగా వేగంగా మరియు చౌకగా మారుతుంది.

భారీ $2.3 బిలియన్ల వాల్యుయేషన్

ఈ ఆశయాల పరిధి కంపెనీ యొక్క ఇటీవలి నిధుల ద్వారా ప్రతిబింబిస్తుంది. Khosla Ventures నేతృత్వంలో జరిగిన ఫండింగ్ రౌండ్‌లో General Intuition $320 మిలియన్లను సేకరించింది, దీనితో కంపెనీ మొత్తం వాల్యుయేషన్ $2.3 బిలియన్లకు చేరుకుంది. ఈ ఇన్వెస్టర్ గ్రూపులో Jeff Bezos, Eric Schmidt మరియు Google DeepMind మరియు MIT పరిశోధకులు వంటి టెక్ రంగ ప్రముఖులు ఉన్నారు.

ఈ మూలధనాన్ని రెండు ప్రాథమిక లక్ష్యాల కోసం కేటాయించారు:

  • Scaling Compute: CoreWeaveతో భాగస్వామ్యం ద్వారా, కంపెనీ తన తదుపరి తరం మోడల్ యొక్క ప్రీ-ట్రైనింగ్ పై దృష్టి సారిస్తుంది.
  • API Accessibility: నిధుల కొంత భాగాన్ని విస్తృతమైన APIని ప్రారంభించడానికి ఉపయోగిస్తారు, ఇది వేసవి చివరి నాటికి డెవలపర్‌లు వారి ఏజెంటిక్ మోడల్‌లను ఉపయోగించుకోవడానికి అవకాశం కల్పిస్తుంది.

పరిశ్రమ Large Language Models (LLMs) యొక్క టెక్స్ట్-హెవీ యుగం నుండి ముందుకు సాగుతున్న కొద్దీ, General Intuition "world models" రంగంలో ముందంజలో నిలవడానికి ప్రయత్నిస్తోంది—అంటే ప్రపంచం గురించి కేవలం మాట్లాడటమే కాకుండా, దాని ద్వారా ఎలా కదలాలి అనే విషయాన్ని అర్థం చేసుకునే AI.

ముఖ్య అంశాలు

  • Action-Driven Training: కేవలం వీడియోల కంటే మానవ గేమ్‌ప్లే "action labels"ను ఉపయోగించడం ద్వారా, మోడల్ కేవలం వీడియో ఆధారిత పద్ధతుల కంటే కారణకతను మరియు స్పేషియల్ రీజనింగ్‌ను చాలా సమర్థవంతంగా నేర్చుకుంటుంది.
  • Scalable Simulation: ఈ స్టార్టప్ ఏజెంట్‌లను శిక్షణ ఇవ్వడానికి వీడియో గేమ్‌లను ఒక "gym" వలె ఉపయోగిస్తుంది, దీనివల్ల భౌతిక రోబోట్‌లను నియంత్రించడానికి అవసరమైన ఖరీదైన, రియల్-వరల్డ్ డేటా పరిమాణం గణనీయంగా తగ్గుతుంది.
  • Strategic Backing: $2.3B వాల్యుయేషన్ మరియు Khosla Ventures మరియు Jeff Bezos వంటి దిగ్గజాల మద్దతుతో, ఈ కంపెనీ జనరలైజ్డ్ AI ఏజెంట్‌లకు ఒక పునాది పొరగా (foundational layer) మారడానికి సిద్ధంగా ఉంది.