Jinsi General Intuition Inavyotumia Michezo ya Video Kujenga AI ya Ulimwengu Halisi
General Intuition inajaribu kuleta mabadiliko makubwa ya mfumo katika roboti kwa kutumia seti kubwa za data za michezo ya video ili kufundisha mifumo ya agentic kwa ajili ya ulimwengu wa kimwili. Kupitia mzunguko mpya wa ufadhili wa dola milioni 320, kampuni hiyo changamoto inabetia kuwa "data ya vitendo" (action data) inayopatikana katika michezo ndiyo kiungo kinachokosekana kwa akili mnemba (AI).
Nguvu ya Lebo za Vitendo na Mantiki ya Nafasi-Muda
Wakati watafiti wengi wa AI wanajaribu kufundisha mifumo kwa kutazama tu video, Afisa Mtendaji Mkuu wa General Intuition, Pim de Witte, anahoji kuwa video pekee haitoshi. Faida ya ushindani ya kampuni hii ipo katika ufikiaji wake wa data ya kipekee kutoka Medal, jukwaa ambapo watumiaji hushiriki vipande vya video vya michezo ya video.
Tofauti na video za kawaida, vipande hivi vina "lebo za vitendo" (action labels) zilizojumuishwa—rekodi sahihi za ni vitufe gani mchezaji alibonyeza na ni lini hasa. Hii inaruhusu mfumo kwenda mbali zaidi ya utambuzi wa mifumo tu; unajifunza mantiki ya nafasi-muda (spatial-temporal reasoning). Kwa kuelewa uhusiano wa moja kwa moja kati ya ingizo maalum (kitendo) na mabadiliko yanayotokea katika mazingira (itikio), AI inaanza kuelewa sababu na matokeo (causality). Hii inaiwezesha mfumo kutofautisha "nafsi" na "mazingira," hitaji la msingi kwa wakala (agent) wowote anayejitawala.
Kutoka Fortnite hadi kwa Roboti za Miguu Minne
Azma ya kiufundi ya kampuni hii ni kuunda mfumo mmoja unaoweza kutumika katika nyanja mbalimbali: mchezo, uigaji (simulation), na uwepo wa kimwili. Katika maonyesho ya hivi karibuni, wakala wa AI aliyefundishwa kupitia michezo aliweza kupita katika mazingira magumu ya kidijitali, akielewa kuwa kuta ni vitu imara na vivuli hubadilika kulingana na mwendo wa jua.
Jambo la muhimu ni kwamba "ubongo" huu unahamishiwa moja kwa moja kwenye vifaa vya kielektroniki (hardware). Kampuni ilionyesha roboti ya miguu minne iliyotumia mfumo uleule unaoendesha wakala wake wa michezo. Inashangaza, timu iliripoti kuwa ilichukua dakika nane tu za data za roboti za ulimwengu halisi—zilizokusanywa kwenye barabara halisi—kufanya marekebisho ya mwisho (fine-tune) ya mfumo kwa ajili ya uongozaji wa roboti hiyo. Hii inaashiria kuwa kazi kubwa ya kujifunza fizikia na utambuzi wa nafasi inafanyika katika "gym" ya michezo ya video, jambo linalofanya utumiaji katika ulimwengu halisi kuwa na ufanisi mkubwa zaidi.
Dau la Dola Bilioni 2.3 kwenye Wakala wa Jumla
Ukubwa wa azma hii unaonekana katika thamani ya kampuni hiyo. General Intuition hivi karibuni ilipata dola milioni 320 kwa thamani ya dola bilioni 2.3, na kuleta jumla ya ufadhili wake uliowaziwa kufikia dola milioni 454. Mzunguko huo uliongozwa na Khosla Ventures, kwa ushiriki mkubwa kutoka kwa General Catalyst, Jeff Bezos, Eric Schmidt, na watafiti kutoka Google DeepMind na MIT.
Mtaji huo umetengwa kwa malengo makuu mawili: kuongeza uwezo wa kompyuta (compute capacity) kupitia ushirikiano na CoreWeave na kufanya API yao ipatikane kwa upana zaidi kufikia mwisho wa msimu wa joto. Kwa wawekezaji kama Vinod Khosla, lengo si tu uboreshaji wa uendeshaji wa kiotomatiki, bali ni kuibuka kwa "hisia za AI" (AI intuition)—uwezo unaofanana na binadamu wa kuelewa ulimwengu kupitia uelewa, badala ya kufuata tu maelekezo yaliyowekwa.
Mambo Muhimu ya Kuzingatia
- Mafunzo Yanayoendeshwa na Vitendo: General Intuition hutumia "lebo za vitendo" za kubonyeza vitufe kutoka kwenye vipande vya michezo ili kufundisha AI kuhusu sababu na matokeo, ikivuka mipaka ya mafunzo yanayotegemea video pekee.
- Uigaji Unaoweza Kupanuliwa: Kwa kutumia michezo ya video kama "gym," kampuni inaweza kufundisha mantiki tata ya nafasi-muda bila gharama kubwa za kukusanya data za roboti za ulimwengu halisi.
- Uungaji Mkono Mkubwa wa Kitaasisi: Kwa thamani ya dola bilioni 2.3 na uungaji mkono kutoka kwa watu kama Jeff Bezos na Eric Schmidt, kampuni inajiweka kama mchezaji muhimu katika enzi ya mifumo ya ulimwengu (world model era).
