மென்மையான ரோபோட்டிக்ஸ் பராமரிப்பிற்கான விளக்குக்கூடிய காரண காரிய வலுவூட்டல் கற்றல் (Explainable Causal RL)
மென்மையான ரோபோக்கள் (Soft robots) தனித்துவமான பராமரிப்புப் பிரச்சனைகளைத் தருகின்றன. விறைப்பான ரோபோக்களைப் போலன்றி, இவை பொருட்களின் சோர்வு (material fatigue), சென்சார் விலகல் (sensor drift) மற்றும் ஆக்சுவேட்டர் ஹிஸ்டெரிசிஸ் (actuator hysteresis) போன்ற சவால்களை எதிர்கொள்கின்றன.
பாரம்பரிய AI இங்கு தோல்வியடைகிறது, ஏனெனில் அது தொடர்புகளை (correlations) மட்டுமே நம்பியிருக்கிறது. மென்மையான ரோபோட்டிக்ஸில், ஒரு அறையில் (chamber) ஏற்படும் சிறிய சிக்கல் மற்ற அறைகளில் தொடர்ச்சியான தோல்விகளை (cascade of failures) ஏற்படுத்தக்கூடும். நீங்கள் வெறும் வடிவங்களை (patterns) மட்டும் பார்க்காமல், காரணத்தையும் விளைவையும் (cause and effect) புரிந்து கொள்ள வேண்டும்.
இதைத் தீர்க்க நான் விளக்குக்கூடிய காரண காரிய வலுவூட்டல் கற்றலை (Explainable Causal Reinforcement Learning - ECRL) உருவாக்கினேன். இந்த அமைப்பு மூன்று விஷயங்களைச் செய்கிறது:
• காரணக் கண்டுபிடிப்பு (Causal Discovery): அழுத்தம் மற்றும் இழுவிசை போன்ற சென்சார் அளவீடுகள் எவ்வாறு தோல்விகளுக்கு வழிவகுக்கின்றன என்பதை இது கற்றுக்கொள்கிறது. • காரணக் அனுமானம் (Causal Inference): இது எதிர்மறைச் சூழல் கேள்விகளுக்கு (counterfactual questions) பதிலளிக்கிறது. "அழுத்தத்தை 10% குறைத்தால் என்ன நடக்கும்?" என்று இது கேட்கிறது. • காரணக் கொள்கை மேம்படுத்தல் (Causal Policy Optimization): ரோபோவின் இயற்பியல் கட்டமைப்பிற்கு மதிப்பளிக்கும் செயல்களை இது கற்றுக்கொள்கிறது.
மிகப்பெரிய சவால் நிகழ்நேரக் கட்டுப்பாடுகள் (real-time constraints) ஆகும். மென்மையான ரோபோக்கள் மில்லி விநாடி கால அளவில் இயங்குகின்றன. ஒரு முடிவு எடுக்க அதிக நேரம் எடுத்தால், ரோபோ உடைந்துவிடும்.
இதைச் சமாளிக்க நான் ஒரு இருநிலை கட்டமைப்பை (two-tier architecture) உருவாக்கினேன்:
- ஒரு வேகமான கொள்கை (A Fast Policy): இது உடனடி, நிகழ்நேர முடிவுகளைக் கையாள்கிறது.
- ஒரு காரணத் திருத்தி (A Causal Corrector): வேகமான செயல் பாதுகாப்பானதுதானா என்பதைச் சரிபார்க்க இது பின்னணியில் இயங்குகிறது.
எனது சோதனைகளில், இந்த அமைப்பு திட்டமிடப்படாத முடங்கலை (unplanned downtime) 73% குறைத்தது. ஒரு 'பிளாக்-பாக்ஸ்' (black-box) பிழைக்கு பதிலாக, இந்த அமைப்பு தனது செயல்களுக்கான தெளிவான காரணங்களை வழங்குகிறது. உதாரணமாக:
"அதிக அழுத்தம் அறை 2-இல் இழுவிசையை ஏற்படுத்தி, நுண்-பிரிப்பிற்கு (micro-delamination) வழிவகுத்தது. உச்ச அழுத்தத்தைக் குறைப்பது தோல்வியை தாமதப்படுத்தும்."
இது மனிதத் தொழில்நுட்ப வல்லுநர்கள் AI-ஐ நம்பி, துல்லியமாகச் செயல்பட அனுமதிக்கிறது.
கற்றுக்கொண்ட பாடங்கள்:
- நிஜ உலகத் தரவுகளைச் சேமிக்க, ஆரம்பக்கட்டப் பயிற்சிக்காக உருவகப்படுத்துதலை (simulation) பயன்படுத்தவும்.
- காரணச் சரிபார்ப்புகளை 2ms-க்கு கீழ் வைத்திருக்க இலகுரக நெட்வொர்க்குகளைப் (lightweight networks) பயன்படுத்தவும்.
- தகவமைப்பு விளக்கங்களை (adaptive explanations) செயல்படுத்தவும். செயலாக்கத் திறனைச் (processing power) சேமிக்க, தோல்வி ஏற்பட வாய்ப்புள்ள போது மட்டுமே ஆழமான விவரங்களை வழங்கவும்.
விருப்பமான கற்றல் சமூகம்: https://t.me/GyaanSetuAi