OpenAI RL ಮೂಲಕ AI ಸುರಕ್ಷತೆಯನ್ನು ಸುಧಾರಿಸಿದೆ

Translated for your language. Read the original.

AI-assisted draft.

9 ಗಂಟೆಗಳ ಹಿಂದೆ1min read

OpenAI RL ಮೂಲಕ AI ಸುರಕ್ಷತೆಯನ್ನು ಸುಧಾರಿಸುತ್ತದೆ

AI ಅನ್ನು ಹೆಚ್ಚು ಸುರಕ್ಷಿತವಾಗಿಸಲು OpenAI ಹೊಸ ಮಾರ್ಗವನ್ನು ಕಂಡುಕೊಂಡಿದೆ. ಮಾದರಿಗಳಿಗೆ (models) ನಿರ್ದಿಷ್ಟ ಗುಣಲಕ್ಷಣಗಳನ್ನು ಕಲಿಸಲು ಅವರು ಸಣ್ಣ ಪ್ರಮಾಣದ Reinforcement Learning (RL) ಅನ್ನು ಬಳಸಿದ್ದಾರೆ. ಈ ಗುಣಲಕ್ಷಣಗಳು ಸತ್ಯಸಂಧತೆ, ನ್ಯಾಯಸಮ್ಮತತೆ ಮತ್ತು ಪ್ರಾಮಾಣಿಕತೆಯನ್ನು ಒಳಗೊಂಡಿವೆ.

ಫಲಿತಾಂಶಗಳು 53 ಸುರಕ್ಷತಾ ಮಾನದಂಡಗಳಲ್ಲಿ (safety benchmarks) 44ರಲ್ಲಿ ಮಾದರಿಯು ಸುಧಾರಣೆಯನ್ನು ತೋರಿಸಿದೆ ಎಂದು ತಿಳಿಸುತ್ತವೆ.

ಈ ವಿಧಾನವನ್ನು ವಿಭಿನ್ನವಾಗಿಸುವುದು ಯಾವುದು:

ಇದು ಬರೆದಿಟ್ಟ ಸಂವಿಧಾನದ ಬದಲಿಗೆ ನಿರ್ದಿಷ್ಟ ಗುಣಲಕ್ಷಣಗಳನ್ನು ಬಳಸುತ್ತದೆ.
ಇದು ಕೆಟ್ಟ ಪ್ರಾಂಪ್ಟ್‌ಗಳ (prompts) ಮೂಲಕ ಮಾದರಿಗಳನ್ನು ಕುತಂತ್ರದಿಂದ ಬಳಸಿಕೊಳ್ಳುವುದನ್ನು ಕಷ್ಟವಾಗಿಸುತ್ತದೆ.
ಇದು ಹಾನಿಕಾರಕ ಫೈನ್-ಟ್ಯೂನಿಂಗ್‌ಗೆ (fine-tuning) ಪ್ರತಿರೋಧಿಸುತ್ತದೆ.
ಇದು ಕೆಟ್ಟ ನಡವಳಿಕೆಯನ್ನು ತಡೆಯುವಾಗಲೂ ಮಾದರಿಯು ಸಹಕಾರಿಯಾಗುವಂತೆ ನೋಡಿಕೊಳ್ಳುತ್ತದೆ.

OpenAI ಇದನ್ನು 'selective

OpenAI RL ಮೂಲಕ AI ಸುರಕ್ಷತೆಯನ್ನು ಸುಧಾರಿಸಿದೆ

Continue reading

𝗣𝗿𝗲 𝗟𝗮𝘂𝗻𝗰𝗵 𝗔𝗜 𝗦𝗶𝗺𝘂𝗹𝗮𝘁𝗶𝗼𝗻𝘀 𝗔𝗿𝗲 𝗧𝗵𝗲 𝗡𝗲𝘄 𝗠𝗼𝗱𝗲𝗹 𝗦𝗮𝗳𝗲𝘁𝘆 𝗖𝗵𝗲𝗰𝗸

ಬಿಡುಗಡೆಗಿಂತ ಮುನ್ನ ನಡೆಸುವ AI ಸಿಮ್ಯುಲೇಶನ್‌ಗಳು ಹೊಸ ಸುರಕ್ಷತಾ ತಪಾಸಣೆಯಾಗಿವೆ

𝗛𝗼𝘄 𝗢𝗽𝗲𝗻𝗔𝗜 𝗮𝗻𝗱 𝗔𝗻𝘁𝗵𝗿𝗼𝗽𝗶𝗰 𝗗𝗲𝘀𝗶𝗴𝗻 𝗔𝗜 𝗦𝘆𝘀𝘁𝗲𝗺𝘀

𝗛𝗼𝘄 𝗢𝗽𝗲𝗻𝗔𝗜 𝗮𝗻𝗱 𝗔𝗻𝘁𝗵𝗿𝗼𝗽𝗶𝗰 𝗗𝗲𝘀𝗶𝗴𝗻 𝗔𝗜 𝗦𝘆𝘀𝘁𝗲𝗺𝘀

ಪ್ರಯೋಜನಕಾರಿ ತರಬೇತಿಯ ಸಣ್ಣ ಪ್ರಮಾಣಗಳು AI ಸುರಕ್ಷತೆಯನ್ನು ಹೆಚ್ಚಿಸುತ್ತವೆ ಎಂದು OpenAI ಕಂಡುಕೊಂಡಿದೆ