General Intuition מגייסת 320 מיליון דולר כדי להפוך נתוני משחקי וידאו לבינה מלאכותית בעולם האמיתי

General Intuition מהמרת על כך שהסודות לאינטליגנציה פיזית טמונים במיליוני שעות של צילומי משחקי וידאו שנאספו על ידי שחקנים. באמצעות מינוף נתוני פעולה (action data) ברמת דיוק גבוהה ממשחקים, הסטארט-אפ שואף לבנות מודלים סוכנים (agentic models) שיכולים לעבור בצורה חלקה מסביבות וירטואליות כמו Fortnite לרובוטים פיזיים בעלי ארבע רגליים (quadrupedal robots).

הכוח של תוויות פעולה (Action Labels) על פני וידאו בלבד

בניגוד למתחרים רבים המנסים לאמן סוכני AI באמצעות צפייה בווידאו בלבד, General Intuition משתמשת ביתרון קנייני שירשה מקודמתה, Medal. בעוד שרוב המודלים מנסים להסיק תנועות מפיקסלים בלבד, General Intuition מנצלת "תוויות פעולה" (action labels) — הלחיצות המדויקות על הכפתורים וחותמות הזמן המוקלטות לצד קטעי המשחק.

הבחנה זו היא קריטית לפיתוח חשיבה מרחבית-זמנית (spatial-temporal reasoning). על ידי ידיעה מדויקת כיצד קלט אנושי מביא לתנועה ספציפית במרחב תלת-ממדי, המודל לומד סיבתיות: כיצד פעולה משפיעה על הסביבה. המנכ"ל Pim de Witte טוען כי הדבר מאפשר למודל להבחין בין ה"עצמי" לבין ה"סביבה", דרישה בסיסית לכל סוכן שנועד לפעול בעולם הפיזי.

מסימולציה של Fortnite להתגלמות רובוטית (Robot Embodiment)

הארכיטקטורה הטכנית של החברה נשענת על "מודל עולם" (world model) המתפקד כ"מכון כושר" (training gym) פנימי לאימון. במקום להסתמך על מנועי משחק מסורתיים, המודל מייצר סביבות פריים אחר פריים, מה שמאפשר לסוכנים ללמוד מציאות מבוססת פיזיקה — כמו מוצקות של קירות או תנועת צללים — באמצעות חזרתיות בלבד.

היישום המעשי של האימון הזה כבר נראה בדגמי החומרה שלהם. החברה פרסה בהצלחה את אותו "מוח" המשמש לניווט בנופים וירטואליים בתוך רובוט גדול בעל ארבע רגליים. באופן מרשים, הצוות דיווח כי נדרשו שמונה דקות בלבד של נתוני רובוטיקה מהעולם האמיתי, שנאספו ברחובות ציבוריים, כדי לבצע כוונון עדין (fine-tune) למודל עבור הניווט הפיזי של הרובוט. הדבר מרמז על כך שהעבודה הקשה של בניית האינטליגנציה מתבצעת בסימולציה, מה שהופך את הפריסה בעולם האמיתי למהירה וזולה משמעותית.

שווי עצים של 2.3 מיליארד דולר

קנה המידה של השאיפה הזו משתקף בגיוס הכספים האחרון של החברה. General Intuition גייסה 320 מיליון דולר בסבב בהובלת Khosla Ventures, מה שהביא את שווי השוק הכולל שלה ל-2.3 מיליארד דולר. קבוצת המשקיעים היא מפלצת טכנולוגית, הכוללת את Jeff Bezos, Eric Schmidt וחוקרים מ-Google DeepMind ו-MIT.

ההון מיועד לשתי מטרות עיקריות:

  • הגדלת כוח המחשוב (Scaling Compute): באמצעות שותפות עם CoreWeave, החברה תתמקד באימון מקדים (pre-training) של הדור הבא של המודל שלה.
  • נגישות API: חלק מהכספים ישמש להשקת API רחב יותר, מה שעשוי לאפשר למפתחים להשתמש במודלים הסוכנים שלהם עד סוף הקיץ.

בעוד התעשייה עוברת מעבר לעידן העמוס בטקסט של מודלי שפה גדולים (LLMs), General Intuition ממצבת את עצמה בחזית ה-"world models" — בינה מלאכותית שלא רק מדברת על העולם, אלא מבינה איך לנוע בתוכו.

נקודות מפתח

  • אימון מונע פעולה (Action-Driven Training): באמצעות שימוש ב"תוויות פעולה" ממשחקי אדם במקום בוידאו בלבד, המודל לומד סיבתיות וחשיבה מרחבית בצורה יעילה הרבה יותר מגישות המבוססות על וידאו בלבד.
  • סימולציה ניתנת להרחבה (Scalable Simulation): הסטארט-אפ משתמש במשחקי וידאו כ"מכון כושר" לאימון סוכנים, מה שמפחית משמעותית את כמות הנתונים היקרים מהעולם האמיתי הנדרשים לשליטה ברובוטים פיזיים.
  • גיבוי אסטרטגי: עם שווי של 2.3 מיליארד דולר וגיבוי מענקי תעשייה כמו Khosla Ventures ו-Jeff Bezos, החברה ממוצבת להפוך לשכבת תשתית עבור סוכני AI כלליים.