כיצד General Intuition משתמשת במשחקי וידאו כדי לבנות בינה מלאכותית לעולם האמיתי
General Intuition מנסה לבצע שינוי פרדיגמה עצום ברובוטיקה על ידי שימוש במאגרי נתונים ענקיים ממשחקי וידאו כדי לאמן מודלים סוכנים (agentic models) עבור העולם הפיזי. עם סבב גיוס חדש של 320 מיליון דולר, הסטארט-אפ מהמרת על כך ש"נתוני הפעולה" (action data) הנמצאים במשחקים הם החוליה החסרה בבינה מלאכותית.
הכוח של תוויות פעולה והסקה מרחבית-זמנית
בעוד שחוקרי בינה מלאכותית רבים מנסים לאמן מודלים על ידי צפייה פשוטה בסרטוני וידאו, מנכ"ל General Intuition, Pim de Witte, טוען כי וידאו לבדו אינו מספיק. היתרון התחרותי של החברה טמון בגישה שלה לנתונים קנייניים מ-Medal, פלטפורמה שבה משתמשים משתפים קליפים ממשחקי וידאו.
בניגוד לווידאו סטנדרטי, קליפים אלו מכילים "תוויות פעולה" (action labels) מוטמעות — רישומים מדויקים של אילו כפתורים השחקן לחץ ומתי בדיוק. זה מאפשר למודל לחרוג מעבר לזיהוי תבניות בלבד; הוא לומד הסקה מרחבית-זמנית. על ידי הבנת הקשר הישיר בין קלט ספציפי (פעולה) לבין השינוי שנוצר בסביבה (התגובה), הבינה המלאכותית מתחילה להבין סיבתיות. דבר זה מאפשר למודל להבחין בין ה"עצמי" לבין ה"סביבה", דרישה בסיסית לכל סוכן אוטונומי.
מ-Fortnite ועד לרובוטים בעלי ארבע רגליים
השאיפה הטכנית של החברה היא ליצור מודל יחיד שיכול להכליל על פני תחומים שונים: משחקיות, סימולציה והתגלמות פיזית (physical embodiment). בהדגמות אחרונות, סוכן בינה מלאכותית שאומן על משחקיות הצליח לנווט בסביבות וירטואליות מורכבות, תוך הבנה שקירות הם עצמים מוצקים וצללים משתנים עם תנועת השמש.
באופן מכריע, ה"מוח" הזה מועבר ישירות לחומרה. החברה הציגה רובוט בעל ארבע רגליים שהשתמש באותו מודל המניע את סוכני המשחק שלה. ראוי לציין כי הצוות דיווח כי נדרשו שמונה דקות בלבד של נתוני רובוטיקה מהעולם האמיתי — שנאספו ברחובות אמיתיים — כדי לבצע כוונון עדין (fine-tune) למודל עבור הניווט של הרובוט. הדבר מרמז על כך שהעבודה הקשה של למידת פיזיקה ומודעות מרחבית נעשית ב"חדר הכושר" של משחקי הווידאו, מה שהופך את הפריסה בעולם האמיתי ליעילה הרבה יותר.
הימור של 2.3 מיליארד דולר על סוכנים כלליים
קנה המידה של שאיפה זו משתקף בשווי השוק של החברה. General Intuition גייסה לאחרונה 320 מיליון דולר בשווי של 2.3 מיליארד דולר, מה שמביא את סך המימון שפורסם ל-454 מיליון דולר. הסבב הובל על ידי Khosla Ventures, עם השתתפות משמעותית של General Catalyst, Jeff Bezos, Eric Schmidt, וחוקרים מ-Google DeepMind ו-MIT.
ההון מיועד לשתי מטרות עיקריות: הרחבת יכולת המחשוב באמצעות שותפות עם CoreWeave והפיכת ה-API שלהם לזמין באופן נרחב יותר עד סוף הקיץ. עבור משקיעים כמו Vinod Khosla, המטרה אינה רק אוטומציה טובה יותר, אלא הופעתה של "אינטואיציה של בינה מלאכותית" — יכולת דמוית אדם לנווט בעולם באמצעות הבנה, ולא רק על ידי מעקב אחר הוראות מתוכנתות.
נקודות מפתח
- אימון מונחה פעולה: General Intuition משתמשת ב"תוויות פעולה" של לחיצות על כפתורים מתוך קליפים של משחקים כדי ללמד בינה מלאכותית סיבתיות, ובכך מתעלה מעבר למגבלות של אימון המבוסס על וידאו בלבד.
- סימולציה ניתנת להרחבה: על ידי שימוש במשחקי וידאו כ"חדר כושר", החברה יכולה לאמן הסקה מרחבית-זמנית מורכבת ללא העלות הכבדה של איסוף נתוני רובוטיקה מהעולם האמיתי.
- תמיכה מוסדית אדירה: עם שווי של 2.3 מיליארד דולר ותמיכה מדמויות כמו Jeff Bezos ו-Eric Schmidt, החברה ממצבת את עצמה כשחקנית יסוד בעידן של מודלים של עולם (world models).
