التعلم التعزيزي السببي القابل للتفسير للاستجابة لأعطال الأقمار الصناعية

يعمل التعلم التعزيزي (RL) التقليدي كصندوق أسود؛ فهو يتعلم الأنماط من البيانات ولكنه لا يفهم سبب حدوث الأشياء.

في عمليات الأقمار الصناعية، يعد هذا الأمر خطيراً. فإذا لاحظ الوكيل انخفاضاً في الطاقة الشمسية، فقد يفترض أن ضوء الشمس يتضاءل. ولكن إذا كان السبب الحقيقي هو الحطام الفضائي، فقد تؤدي استجابة الوكيل إلى تعطل النظام بالكامل.

لقد استكشفت حلاً يتمثل في: التعلم التعزيزي السببي القابل للتفسير (ECRL).

يستخدم هذا النهج النماذج السببية الهيكلية (SCM). فبدلاً من مجرد رؤية الارتباطات، يفهم الوكيل السبب والنتيجة، ويمكنه الإجابة على سؤال: "ماذا سيحدث لو اتخذت إجراءً مختلفاً؟"

هذا الأمر حيوي عند العمل مع فرق عالمية؛ حيث يحتاج المهندسون ومخططو المهام والجهات التنظيمية جميعاً إلى إجابات، كما أنهم يتحدثون لغات مختلفة ولديهم احتياجات متنوعة.

تركز بحثي على ثلاث ركائز:

  • الاكتشاف السببي: يتعلم الوكيل العلاقة بين المتغيرات مثل درجة حرارة محرك الدفع وتدفق الوقود.
  • القابلية للتفسير: ينتج الوكيل مساراً منطقياً يوضح "السبب" وراء كل قرار.
  • التكيف متعدد اللغات: يقوم النظام بترجمة المنطق التقني إلى لغات مختلفة.

لقد وجدت أن الترجمة وحدها لا تكفي، فالسياق الثقافي يلعب دوراً هاماً.

  • غالباً ما يفضل أصحاب المصلحة اليابانيون الملخصات التي تؤكد على الإجماع الجماعي.
  • غالباً ما يريد أصحاب المصلحة الألمان احتمالات وبيانات دقيقة.
  • قد يتطلب المسؤولون الناطقون باللغة العربية مبررات رسمية تركز على السلامة.

يتعامل نظام ECRL مع هذه الاحتياجات من خلال بناء تسلسل هرمي للتفسير يتكون من ثلاثة مستويات:

  • المستوى التنفيذي: ملخصات بسيطة لاتخاذ قرارات سريعة.
  • المستوى التقني: مسارات سببية مفصلة للمهندسين.
  • المستوى العميق: براهين رياضية كاملة للباحثين.

من خلال الجمع بين السببية والذكاء الاصطناعي متعدد اللغات، ننتقل من الأتمتة القائمة على "الصندوق الأسود" إلى عمليات أقمار صناعية شفافة وموثوقة.

المصدر: https://dev.to/rikinptl/explainable-causal-reinforcement-learning-for-satellite-anomaly-response-operations-across-4p0p

مجتمع تعليمي اختياري: https://t.me/GyaanSetuAi