OpenAI RL ಮೂಲಕ AI ಸುರಕ್ಷತೆಯನ್ನು ಸುಧಾರಿಸುತ್ತದೆ

AI ಅನ್ನು ಹೆಚ್ಚು ಸುರಕ್ಷಿತವಾಗಿಸಲು OpenAI ಹೊಸ ಮಾರ್ಗವನ್ನು ಕಂಡುಕೊಂಡಿದೆ. ಮಾದರಿಗಳಿಗೆ (models) ನಿರ್ದಿಷ್ಟ ಗುಣಲಕ್ಷಣಗಳನ್ನು ಕಲಿಸಲು ಅವರು ಸಣ್ಣ ಪ್ರಮಾಣದ Reinforcement Learning (RL) ಅನ್ನು ಬಳಸಿದ್ದಾರೆ. ಈ ಗುಣಲಕ್ಷಣಗಳು ಸತ್ಯಸಂಧತೆ, ನ್ಯಾಯಸಮ್ಮತತೆ ಮತ್ತು ಪ್ರಾಮಾಣಿಕತೆಯನ್ನು ಒಳಗೊಂಡಿವೆ.

ಫಲಿತಾಂಶಗಳು 53 ಸುರಕ್ಷತಾ ಮಾನದಂಡಗಳಲ್ಲಿ (safety benchmarks) 44ರಲ್ಲಿ ಮಾದರಿಯು ಸುಧಾರಣೆಯನ್ನು ತೋರಿಸಿದೆ ಎಂದು ತಿಳಿಸುತ್ತವೆ.

ಈ ವಿಧಾನವನ್ನು ವಿಭಿನ್ನವಾಗಿಸುವುದು ಯಾವುದು:

  • ಇದು ಬರೆದಿಟ್ಟ ಸಂವಿಧಾನದ ಬದಲಿಗೆ ನಿರ್ದಿಷ್ಟ ಗುಣಲಕ್ಷಣಗಳನ್ನು ಬಳಸುತ್ತದೆ.
  • ಇದು ಕೆಟ್ಟ ಪ್ರಾಂಪ್ಟ್‌ಗಳ (prompts) ಮೂಲಕ ಮಾದರಿಗಳನ್ನು ಕುತಂತ್ರದಿಂದ ಬಳಸಿಕೊಳ್ಳುವುದನ್ನು ಕಷ್ಟವಾಗಿಸುತ್ತದೆ.
  • ಇದು ಹಾನಿಕಾರಕ ಫೈನ್-ಟ್ಯೂನಿಂಗ್‌ಗೆ (fine-tuning) ಪ್ರತಿರೋಧಿಸುತ್ತದೆ.
  • ಇದು ಕೆಟ್ಟ ನಡವಳಿಕೆಯನ್ನು ತಡೆಯುವಾಗಲೂ ಮಾದರಿಯು ಸಹಕಾರಿಯಾಗುವಂತೆ ನೋಡಿಕೊಳ್ಳುತ್ತದೆ.

OpenAI ಇದನ್ನು 'selective