నిజ ప్రపంచ AIని నిర్మించడానికి General Intuition వీడియో గేమ్‌లను ఎలా ఉపయోగిస్తోంది

భౌతిక ప్రపంచం కోసం ఏజెంటిక్ మోడల్స్‌ను (agentic models) శిక్షణ ఇవ్వడానికి భారీ వీడియో గేమ్ డేటాసెట్‌లను ఉపయోగించడం ద్వారా General Intuition రోబోటిక్స్‌లో ఒక భారీ పారాడైమ్ షిఫ్ట్‌ను (paradigm shift) ప్రయత్నిస్తోంది. కొత్తగా $320 మిలియన్ల నిధుల సేకరణతో, గేమింగ్‌లో లభించే "యాక్షన్ డేటా" (action data) కృత్రిమ మేధస్సు (AI) కి కావాల్సిన కీలకమైన అంశమని ఈ స్టార్టప్ నమ్ముతోంది.

యాక్షన్ లేబుల్స్ మరియు స్పేషియల్-టెంపోరల్ రీజనింగ్ యొక్క శక్తి

చాలా మంది AI పరిశోధకులు కేవలం వీడియో ఫుటేజీని గమనించడం ద్వారా మోడల్స్‌కు శిక్షణ ఇవ్వడానికి ప్రయత్నిస్తుంటే, వీడియో మాత్రమే సరిపోదని General Intuition CEO Pim de Witte వాదిస్తున్నారు. వినియోగదారులు వీడియో గేమ్ క్లిప్‌లను పంచుకునే ప్లాట్‌ఫామ్ అయిన Medal నుండి సొంత డేటాను పొందడం ఈ కంపెనీ యొక్క ప్రత్యేక బలం.

సాధారణ వీడియోలలా కాకుండా, ఈ క్లిప్‌లలో "యాక్షన్ లేబుల్స్" (action labels) ఉంటాయి—అంటే ప్లేయర్ ఏ బటన్‌లను, ఏ సమయంలో నొక్కారో తెలిపే ఖచ్చితమైన రికార్డులు. ఇది మోడల్ కేవలం ప్యాటర్న్ రికగ్నిషన్ (pattern recognition) స్థాయికి మాత్రమే పరిమితం కాకుండా, స్పేషియల్-టెంపోరల్ రీజనింగ్ (spatial-temporal reasoning) నేర్చుకోవడానికి సహాయపడుతుంది. ఒక నిర్దిష్ట ఇన్‌పుట్ (ఒక చర్య) మరియు దాని వల్ల పర్యావరణంలో వచ్చే మార్పు (ప్రతిచర్య) మధ్య ఉన్న ప్రత్యక్ష సంబంధాన్ని అర్థం చేసుకోవడం ద్వారా, AI కారణాంతర సంబంధాన్ని (causality) గ్రహించడం ప్రారంభిస్తుంది. ఇది మోడల్ "స్వయంగా" మరియు "పర్యావరణం" మధ్య తేడాను గుర్తించగలదు, ఇది ఏ స్వయంప్రతిపత్తి కలిగిన ఏజెంట్‌కైనా (autonomous agent) ప్రాథమిక అవసరం.

Fortnite నుండి క్వాడ్రుపెడ్ రోబోట్‌ల వరకు

గేమ్‌ప్లే, సిమ్యులేషన్ మరియు భౌతిక రూపం (physical embodiment) వంటి వివిధ డొమైన్‌లలో పనిచేసేలా ఒకే మోడల్‌ను సృష్టించడమే ఈ కంపెనీ సాంకేతిక లక్ష్యం. ఇటీవలి ప్రదర్శనలలో, గేమ్‌ప్లేపై శిక్షణ పొందిన ఒక AI ఏజెంట్ సంక్లిష్టమైన వర్చువల్ వాతావరణంలో ప్రయాణించగలిగింది; గోడలు గట్టి వస్తువులని మరియు సూర్యుడి కదలికతో నీడలు మారుతాయని అది అర్థం చేసుకుంది.

ముఖ్యంగా, ఈ "మెదడు" నేరుగా హార్డ్‌వేర్‌కు బదిలీ చేయబడుతోంది. తమ గేమింగ్ ఏజెంట్లకు శక్తినిచ్చే అదే మోడల్‌ను ఉపయోగించే క్వాడ్రుపెడల్ (నాలుగు కాళ్లు కలిగిన) రోబోట్‌ను కంపెనీ ప్రదర్శించింది. విశేషమేమిటంటే, రోబోట్ నావిగేషన్ కోసం మోడల్‌ను ఫైన్-ట్యూన్ చేయడానికి నిజమైన వీధుల్లో సేకరించిన కేవలం ఎనిమిది నిమిషాల రియల్-వరల్డ్ రోబోటిక్స్ డేటా మాత్రమే సరిపోయిందని బృందం తెలిపింది. భౌతిక శాస్త్రం (physics) మరియు స్పేషియల్ అవగాహనను నేర్చుకునే కష్టమైన పని వీడియో గేమ్స్ అనే "జిమ్"లో జరుగుతోందని, దీనివల్ల నిజ ప్రపంచంలో రోబోట్‌లను వినియోగించడం చాలా సమర్థవంతంగా మారుతుందని ఇది సూచిస్తుంది.

జనరల్ ఏజెంట్లపై $2.3 బిలియన్ల పందెం

ఈ ఆశయాల పరిధి కంపెనీ వాల్యుయేషన్‌లో కనిపిస్తుంది. General Intuition ఇటీవల $2.3 బిలియన్ల వాల్యుయేషన్‌తో $320 మిలియన్లను సేకరించింది, దీనితో కంపెనీ మొత్తం వెల్లడించిన నిధులు $454 మిలియన్లకు చేరుకున్నాయి. ఈ నిధుల సేకరణకు Khosla Ventures నాయకత్వం వహించగా, General Catalyst, Jeff Bezos, Eric Schmidt మరియు Google DeepMind, MIT పరిశోధకులు ఇందులో పాల్గొన్నారు.

ఈ మూలధనాన్ని రెండు ప్రధాన లక్ష్యాల కోసం కేటాయించారు: CoreWeaveతో భాగస్వామ్యం ద్వారా కంప్యూట్ సామర్థ్యాన్ని (compute capacity) పెంచడం మరియు వేసవి చివరి నాటికి వారి APIని మరింత విస్తృతంగా అందుబాటులోకి తీసుకురావడం. వినోద్ ఖోస్లా వంటి పెట్టుబడిదారుల దృష్టిలో, లక్ష్యం కేవలం మెరుగైన ఆటోమేషన్ మాత్రమే కాదు, "AI ఇంట్యూషన్" (AI intuition) యొక్క ఆవిర్భావం—అంటే కేవలం ప్రోగ్రామ్ చేసిన సూచనలను అనుసరించడం కాకుండా, అవగాహన ద్వారా ప్రపంచాన్ని అర్థం చేసుకుంటూ ముందుకు సాగే మానవ సామర్థ్యం.

ముఖ్య అంశాలు

  • యాక్షన్-డ్రివెన్ ట్రైనింగ్: General Intuition వీడియో-మాత్రమే శిక్షణ ఇచ్చే పరిమితులను అధిగమించి, AIకి కారణాంతర సంబంధాన్ని (causality) నేర్పడానికి గేమింగ్ క్లిప్‌ల నుండి బటన్-ప్రెస్ "యాక్షన్ లేబుల్స్"ను ఉపయోగిస్తుంది.
  • స్కేలబుల్ సిమ్యులేషన్: వీడియో గేమ్‌లను ఒక "జిమ్"గా ఉపయోగించడం ద్వారా, కంపెనీ నిజ ప్రపంచ రోబోటిక్ డేటాను సేకరించే భారీ ఖర్చు లేకుండా సంక్లిష్టమైన స్పేషియల్-టెంపోరల్ రీజనింగ్‌కు శిక్షణ ఇవ్వగలదు.
  • భారీ సంస్థాగత మద్దతు: $2.3 బిలియన్ల వాల్యుయేషన్ మరియు Jeff Bezos, Eric Schmidt వంటి ప్రముఖుల మద్దతుతో, ఈ కంపెనీ 'వరల్డ్ మోడల్' (world model) యుగంలో ఒక కీలక పాత్ర పోషించే సంస్థగా తనను తాను సిద్ధం చేసుకుంటోంది.