OpenAI RL ಮೂಲಕ AI ಸುರಕ್ಷತೆಯನ್ನು ಸುಧಾರಿಸುತ್ತದೆ
AI ಅನ್ನು ಹೆಚ್ಚು ಸುರಕ್ಷಿತವಾಗಿಸಲು OpenAI ಹೊಸ ಮಾರ್ಗವನ್ನು ಕಂಡುಕೊಂಡಿದೆ. ಮಾದರಿಗಳಿಗೆ (models) ನಿರ್ದಿಷ್ಟ ಗುಣಲಕ್ಷಣಗಳನ್ನು ಕಲಿಸಲು ಅವರು ಸಣ್ಣ ಪ್ರಮಾಣದ Reinforcement Learning (RL) ಅನ್ನು ಬಳಸಿದ್ದಾರೆ. ಈ ಗುಣಲಕ್ಷಣಗಳು ಸತ್ಯಸಂಧತೆ, ನ್ಯಾಯಸಮ್ಮತತೆ ಮತ್ತು ಪ್ರಾಮಾಣಿಕತೆಯನ್ನು ಒಳಗೊಂಡಿವೆ.
ಫಲಿತಾಂಶಗಳು 53 ಸುರಕ್ಷತಾ ಮಾನದಂಡಗಳಲ್ಲಿ (safety benchmarks) 44ರಲ್ಲಿ ಮಾದರಿಯು ಸುಧಾರಣೆಯನ್ನು ತೋರಿಸಿದೆ ಎಂದು ತಿಳಿಸುತ್ತವೆ.
ಈ ವಿಧಾನವನ್ನು ವಿಭಿನ್ನವಾಗಿಸುವುದು ಯಾವುದು:
- ಇದು ಬರೆದಿಟ್ಟ ಸಂವಿಧಾನದ ಬದಲಿಗೆ ನಿರ್ದಿಷ್ಟ ಗುಣಲಕ್ಷಣಗಳನ್ನು ಬಳಸುತ್ತದೆ.
- ಇದು ಕೆಟ್ಟ ಪ್ರಾಂಪ್ಟ್ಗಳ (prompts) ಮೂಲಕ ಮಾದರಿಗಳನ್ನು ಕುತಂತ್ರದಿಂದ ಬಳಸಿಕೊಳ್ಳುವುದನ್ನು ಕಷ್ಟವಾಗಿಸುತ್ತದೆ.
- ಇದು ಹಾನಿಕಾರಕ ಫೈನ್-ಟ್ಯೂನಿಂಗ್ಗೆ (fine-tuning) ಪ್ರತಿರೋಧಿಸುತ್ತದೆ.
- ಇದು ಕೆಟ್ಟ ನಡವಳಿಕೆಯನ್ನು ತಡೆಯುವಾಗಲೂ ಮಾದರಿಯು ಸಹಕಾರಿಯಾಗುವಂತೆ ನೋಡಿಕೊಳ್ಳುತ್ತದೆ.
OpenAI ಇದನ್ನು 'selective