למידת חיזוק סיבתית ניתנת להסבר לתחזוקת רובוטיקה רכה
רובוטים רכים מציבים בעיות תחזוקה ייחודיות. בניגוד לרובוטים קשיחים, הם מתמודדים עם עייפות חומרים, סחיפת חיישנים (sensor drift) והיסטרזיס של אקטואטורים.
בינה מלאכותית מסורתית נכשלת כאן מכיוון שהיא מסתמכת על מתאמים (correlations). ברובוטיקה רכה, בעיה קטנה בתא אחד יכולה לגרום לשלשלת של כשלים בתאים אחרים. עליך להבין סיבה ותוצאה, לא רק דפוסים.
פיתחתי למידת חיזוק סיבתית ניתנת להסבר (Explainable Causal Reinforcement Learning - ECRL) כדי לפתור זאת. מערכת זו מבצעת שלושה דברים:
• גילוי סיבתי (Causal Discovery): היא לומדת כיצד קריאות חיישנים כמו לחץ ומאמץ מובילות לכשלים. • הסקה סיבתית (Causal Inference): היא עונה על שאלות קונטרפקטיביות (counterfactual). היא שואלת, "מה יקרה אם נוריד את הלחץ ב-10%?" • אופטימיזציה של מדיניות סיבתית (Causal Policy Optimization): היא לומדת פעולות המכבדות את המבנה הפיזי של הרובוט.
האתגר הגדול ביותר הוא מגבלות זמן אמת. רובוטים רכים פועלים בלוחות זמנים של מילישניות. אם החלטה לוקחת זמן רב מדי, הרובוט נשבר.
בניתי ארכיטקטורה דו-שכבתית כדי לטפל בכך:
- מדיניות מהירה (Fast Policy): מטפלת בהחלטות מיידיות בזמן אמת.
- מתקן סיבתי (Causal Corrector): פועל ברקע כדי לבדוק אם הפעולה המהירה בטוחה.
המערכת הזו הפחיתה את זמן ההשבתה הבלתי מתוכנן ב-73% בבדיקות שלי. במקום שגיאת "קופסה שחורה", המערכת מספקת סיבות ברורות לפעולותיה. לדוגמה:
"לחץ גבוה גרם למאמץ בתא 2, מה שהוביל למיקרו-דלמינציה (micro-delamination). הפחתת לחץ השיא תעכב את הכשל."
זה מאפשר לטכנאים אנושיים לסמוך על הבינה המלאכותית ולפעול בדיוק רב.
לקחים שנלמדו:
- השתמשו בסימולציה לאימון ראשוני כדי לחסוך בנתוני עולם אמיתי.
- השתמשו ברשתות קלות משקל כדי לשמור על בדיקות סיבתיות מתחת ל-2ms.
- הטמיעו הסברים אדפטיביים. ספקו פרטים מעמיקים רק כאשר סביר שיתרחש כשל, כדי לחסוך בכוח עיבוד.
קהילת למידה אופציונלית: https://t.me/GyaanSetuAi