XDOF צצה כדי לפתור את צוואר הבקבוק הקריטי של הנתונים ב-Physical AI
ככל שהמרוץ אחר בינה פיזית (physical intelligence) מתחמם עם השקת תוכנית הרובוטיקה מחדש של OpenAI, עלה אתגר חדש: המחסור בנתוני אימון ברמת דיוק גבוהה (high-fidelity). בעוד שמודלי שפה גדולים (LLMs) שגשרו על המרחב העצום של האינטרנט הציבורי, רובוטיקה דורשת נתוני אינטראקציה פיזיים ומדויקים שמאגרי הנתונים הנוכחיים פשוט אינם יכולים לספק.
פער הנתונים: מדוע LLMs לא יפתרו את בעיית הרובוטיקה
המכשול העיקרי בפיתוח רובוטים בעלי יכולת אינו רק כוח מחשוב או ארכיטקטורת מודל; אלא היעדר "חפיר נתונים" (data moat) הניתן להשוואה לטקסט המשמש למודלי GPT. חלופות קיימות, כגון סרטוני YouTube או צילומים באיכות נמוכה שנאספו על ידי עובדי gig, קשות להתאמה למציאות הפיזית המורכבת של תנועה רובוטית. בעיית ה"ביצה והתרנגולת" הזו — הצורך בנתונים כדי לאמן מודלים, אך הצורך במודלים כדי לאסוף נתונים יעילים — הפכה לצוואר הבקבוק העיקרי בתעשייה.
XDOF, סטארט-אפ היוצא ממעטפת (stealth), ממצב את עצמו כשכבת התשתית לפתרון בעיה זו. לאחר שגייסה 70 מיליון דולר מ"שחקנים כבדים" הכוללים את Thrive Capital, Spark Capital, a16z, Lux ו-WndrCo, החברה בונה את צינורות הנתונים (pipelines), כלי האיסוף ומערכות התיוג (annotation) שמעבדות AI פורצות דרך מתקשות לבנות באופן עצמאי.
בניית מאגר הנתונים ABC ופירמידת הנתונים
כדי להניע את האקוסיסטם, XDOF משתפת פעולה עם מעבדת מחקר ה-AI של UC Berkeley כדי לשחרר את "ABC", אוסף עצום של נתוני אימון רובוטיים באיכות גבוהה. מאגר נתונים זה כולל:
- 130,000 מסלולים (trajectories) של נתוני מניפולציה רובוטית.
- 300 שעות של נתוני סימולציה.
- 100 שעות של הערכות.
באמצעות נתונים אלו, צוותים כבר הצליחו לאמן רובוטים על משימות מפורטות (granular) כגון קיפול חולצות T, יישור קופסאות וביצוע פעולות עדינות כמו הכנסת AirPods למארזים שלהם.
האסטרטגיה של XDOF עוקבת אחר "פירמידת נתונים" בת שלוש שכבות כדי להבטיח למידה מקיפה. השכבה בעלת הערך הרב ביותר כוללת נתוני טל-אופרציה (teleoperation) שנאספים ישירות על הרובוט המיועד. אחריה מגיעים נתונים כלליים שנאספים באמצעות מכשירים כמו GELLO (מערכת טל-אופרציה בעלות נמוכה שפותחה על ידי מייסדי XDOF, Philippe Wu ו-Fred Shentu). השכבה האחרונה כוללת נתונים "אגוצנטריים" (egocentric), שבהם בני אדם מבצעים משימות יומיומיות תוך לבישת חיישנים קנייניים של XDOF כדי ללכוד תנועה פיזית מנקודת מבט ראשונה.
להגדיל קנה מידה מעבר למעבדות החלוציות
שאלה קריטית עבור משקיעים היא מדוע מעבדות AI מרכזיות לא פשוט בונות את מפעלות הנתונים הללו בעצמן. לדברי המנכ"ל פיליפ וו (Philippe Wu), המורכבות התפעולית היא עצומה. ניהול פעילות איסוף נתונים דורש מאות אלפי רגל רבוע של שטחי מחסנים, מאות רובוטים מכוילים, וכוח אדם מאומן וגדול של מפעילים מרחוק (teleoperators).
באמצעות התמחות בעבודה ה"לא נוצצת" הזו — הכוללת ניקוי נתונים וכיול ספציפי לחומרה — XDOF מאפשרת למעבדות AI להתמקד בארכיטקטורת המודל, בעוד XDOF מנהלת את הנטל הלוגיסטי העצום של ייצור נתונים פיזיים. שם החברה, משחק מילים על "דרגות חופש" (degrees of freedom), משקף את מטרתה לספק נתונים לכל מורכבות תנועה שרירותית, משבע דרגות החופש של זרוע אנושית ועד ל-30 של רובוט אנושי (humanoid).
תובנות מרכזיות
- תשתיות על פני מודלים: XDOF נותנת מענה לצוואר הבקבוק של ה-"physical AI" על ידי אספקת צינורות הנתונים (data pipelines) הייעודיים וכלי התיוג שחסרים למעבדות המתמקדות ב-LLM.
- מאגרי נתונים ברמת דיוק גבוהה: שחרור מאגר הנתונים ABC מספק לתעשייה קנה מידה חסר תקדים, הכולל 130,000 מסלולי מניפולציה (manipulation trajectories).
- מיקור חוץ תפעולי: XDOF מאפשרת למעבדות החלוציות לעקוף את הדרישות ההוניות והלוגיסטיות העצומות של ניהול מחסני נתונים פיזיים בקנה מידה גדול וצי של מפעילים מרחקים (teleoperation fleets).