XDOF צצה כדי לפתור את צוואר הבקבוק הקריטי של הנתונים ב-Physical AI

ככל שהמרוץ אחר בינה פיזית (physical intelligence) מתחמם עם השקת תוכנית הרובוטיקה מחדש של OpenAI, עלה אתגר חדש: המחסור בנתוני אימון ברמת דיוק גבוהה (high-fidelity). בעוד שמודלי שפה גדולים (LLMs) שגשרו על המרחב העצום של האינטרנט הציבורי, רובוטיקה דורשת נתוני אינטראקציה פיזיים ומדויקים שמאגרי הנתונים הנוכחיים פשוט אינם יכולים לספק.

פער הנתונים: מדוע LLMs לא יפתרו את בעיית הרובוטיקה

המכשול העיקרי בפיתוח רובוטים בעלי יכולת אינו רק כוח מחשוב או ארכיטקטורת מודל; אלא היעדר "חפיר נתונים" (data moat) הניתן להשוואה לטקסט המשמש למודלי GPT. חלופות קיימות, כגון סרטוני YouTube או צילומים באיכות נמוכה שנאספו על ידי עובדי gig, קשות להתאמה למציאות הפיזית המורכבת של תנועה רובוטית. בעיית ה"ביצה והתרנגולת" הזו — הצורך בנתונים כדי לאמן מודלים, אך הצורך במודלים כדי לאסוף נתונים יעילים — הפכה לצוואר הבקבוק העיקרי בתעשייה.

XDOF, סטארט-אפ היוצא ממעטפת (stealth), ממצב את עצמו כשכבת התשתית לפתרון בעיה זו. לאחר שגייסה 70 מיליון דולר מ"שחקנים כבדים" הכוללים את Thrive Capital, Spark Capital, a16z, Lux ו-WndrCo, החברה בונה את צינורות הנתונים (pipelines), כלי האיסוף ומערכות התיוג (annotation) שמעבדות AI פורצות דרך מתקשות לבנות באופן עצמאי.

בניית מאגר הנתונים ABC ופירמידת הנתונים

כדי להניע את האקוסיסטם, XDOF משתפת פעולה עם מעבדת מחקר ה-AI של UC Berkeley כדי לשחרר את "ABC", אוסף עצום של נתוני אימון רובוטיים באיכות גבוהה. מאגר נתונים זה כולל:

באמצעות נתונים אלו, צוותים כבר הצליחו לאמן רובוטים על משימות מפורטות (granular) כגון קיפול חולצות T, יישור קופסאות וביצוע פעולות עדינות כמו הכנסת AirPods למארזים שלהם.

האסטרטגיה של XDOF עוקבת אחר "פירמידת נתונים" בת שלוש שכבות כדי להבטיח למידה מקיפה. השכבה בעלת הערך הרב ביותר כוללת נתוני טל-אופרציה (teleoperation) שנאספים ישירות על הרובוט המיועד. אחריה מגיעים נתונים כלליים שנאספים באמצעות מכשירים כמו GELLO (מערכת טל-אופרציה בעלות נמוכה שפותחה על ידי מייסדי XDOF, Philippe Wu ו-Fred Shentu). השכבה האחרונה כוללת נתונים "אגוצנטריים" (egocentric), שבהם בני אדם מבצעים משימות יומיומיות תוך לבישת חיישנים קנייניים של XDOF כדי ללכוד תנועה פיזית מנקודת מבט ראשונה.

להגדיל קנה מידה מעבר למעבדות החלוציות

שאלה קריטית עבור משקיעים היא מדוע מעבדות AI מרכזיות לא פשוט בונות את מפעלות הנתונים הללו בעצמן. לדברי המנכ"ל פיליפ וו (Philippe Wu), המורכבות התפעולית היא עצומה. ניהול פעילות איסוף נתונים דורש מאות אלפי רגל רבוע של שטחי מחסנים, מאות רובוטים מכוילים, וכוח אדם מאומן וגדול של מפעילים מרחוק (teleoperators).

באמצעות התמחות בעבודה ה"לא נוצצת" הזו — הכוללת ניקוי נתונים וכיול ספציפי לחומרה — XDOF מאפשרת למעבדות AI להתמקד בארכיטקטורת המודל, בעוד XDOF מנהלת את הנטל הלוגיסטי העצום של ייצור נתונים פיזיים. שם החברה, משחק מילים על "דרגות חופש" (degrees of freedom), משקף את מטרתה לספק נתונים לכל מורכבות תנועה שרירותית, משבע דרגות החופש של זרוע אנושית ועד ל-30 של רובוט אנושי (humanoid).

תובנות מרכזיות