用于软体机器人维护的可解释因果强化学习
软体机器人面临着独特的维护问题。与刚性机器人不同,它们面临着材料疲劳、传感器漂移和执行器滞后等问题。
传统的 AI 在这里会失效,因为它依赖于相关性。在软体机器人领域,一个腔室中的微小问题可能会引发其他腔室的连锁故障。你需要理解的是因果关系,而不仅仅是模式。
我开发了可解释因果强化学习 (ECRL) 来解决这个问题。该系统可以实现三件事:
• 因果发现:学习压力和应变等传感器读数是如何导致故障的。 • 因果推理:回答反事实问题。例如:“如果我们把压力降低 10%,会发生什么?” • 因果策略优化:学习符合机器人物理结构的动作。
最大的挑战是实时性约束。软体机器人的运行时间尺度是以毫秒计的。如果决策耗时过长,机器人就会损坏。
我构建了一个两层架构来处理这个问题:
- 快速策略:处理即时的、实时的决策。
- 因果修正器:在后台运行,以检查快速动作是否安全。
在我的测试中,该系统将非计划停机时间减少了 73%。该系统不再提供“黑盒式”的错误提示,而是为其行为提供清晰的理由。例如:
“高压导致 2 号腔室产生应变,进而引发微观分层。降低峰值压力将延迟故障发生。”
这使得人类技术人员能够信任 AI 并进行精准操作。
经验教训:
- 使用仿真进行初始训练,以节省现实世界的数据。
- 使用轻量级网络,将因果检查保持在 2 毫秒以内。
- 实现自适应解释。仅在可能发生故障时才提供深度细节,以节省处理能力。
可选学习社区:https://t.me/GyaanSetuAi