ಪ್ರೀ-ಲಾँच AI ಸಿಮ್ಯುಲೇಶನ್ಗಳು ಹೊಸ ಮಾಡೆಲ್ ಸುರಕ್ಷತಾ ಪರಿಶೀಲನೆಗಳಾಗಿವೆ
AI ಸುರಕ್ಷತೆಯು ಬದಲಾಗುತ್ತಿದೆ. ಇದು ಎಚ್ಚರಿಕೆ ಲೇಬಲ್ಗಳಿಂದ ತಾಲೀಮುಗಳ (rehearsals) ಕಡೆಗೆ ಸಾಗುತ್ತಿದೆ.
OpenAI ಇತ್ತೀಚೆಗೆ ಮಾಡೆಲ್ ಬಿಡುಗಡೆ ಮಾಡುವ ಮೊದಲು ಅದರ ನಡವಳಿಕೆಯನ್ನು ಮುನ್ಸೂಚಿಸುವ ಕುರಿತಾದ ಕೆಲಸವನ್ನು ಹಂಚಿಕೊಂಡಿದೆ. ಜನರು ಮತ್ತು ದಾಳಿಕೋರರು (attackers) ನೈಜ ಜೀವನದಲ್ಲಿ ಮಾಡೆಲ್ಗಳನ್ನು ಹೇಗೆ ಬಳಸುತ್ತಾರೆ ಎಂಬುದನ್ನು ಅನುಕರಿಸಲು ಅವರು ಸಿಮ್ಯುಲೇಶನ್ಗಳನ್ನು ಬಳಸುತ್ತಾರೆ.
ಇದು ಎಲ್ಲಾ ನಿರ್ಮಾತಾಗಳಿಗೆ (builders) ಒಂದು ಸಂಕೇತವಾಗಿದೆ. ನೀವು ಮಾಡೆಲ್ಗಳನ್ನು ಬಿಡುಗಡೆ ಮಾಡಿ, ನಂತರ ಉಂಟಾಗುವ ಪರಿಣಾಮಗಳನ್ನು ಮೇಲ್ವಿಚಾರಣೆ ಮಾಡುವುದನ್ನು ನಿಲ್ಲಿಸಬೇಕು. ನೀವು ಬಿಡುಗಡೆ ಮಾಡುವ ಮೊದಲೇ ಆ ಪರಿಣಾಮಗಳನ್ನು ಸಿಮ್ಯುಲೇಟ್ ಮಾಡಲು ಪ್ರಾರಂಭಿಸಬೇಕು.
ಪ್ರಮಾಣಿತ ಮೌಲ್ಯಮಾಪನಗಳು (Standard evaluations) ಬೆಂಚ್ಮಾರ್ಕ್ಗಳು ಮತ್ತು ರೆಡ್-ಟೀಮಿಂಗ್ (red-teaming) ಮೇಲೆ ಕೇಂದ್ರೀಕರಿಸುತ್ತವೆ. ಇವು ಒಂದು ಪ್ರಮುಖ ಅಂಶವನ್ನು ಮಿಸ್ ಮಾಡುತ್ತವೆ. ನೈಜ ಕೆಲಸದ ಹರಿವಿನ (workflows) ಒಳಗಡೆ ಮಾಡೆಲ್ಗಳು ವಿಭಿನ್ನವಾಗಿ ವರ್ತಿಸುತ್ತವೆ.
ಆರೋಗ್ಯ ರಕ್ಷಣೆಯಲ್ಲಿನ ಚಾಟ್ಬಾಟ್, ರೆಪೊಸಿಟರಿ (repo) ಪ್ರವೇಶವಿರುವ ಕೋಡಿಂಗ್ ಏಜೆಂಟ್ನಂತೆ ಕೆಲಸ ಮಾಡುವುದಿಲ್ಲ. ಮಾಡೆಲ್ ಒಂದೇ ಆಗಿದ್ದರೂ, ಅನುಮತಿಗಳು (permissions) ಮತ್ತು ಬಳಕೆದಾರರ ನಿರೀಕ್ಷೆಗಳು ಬದಲಾಗುತ್ತವೆ.
ನಿಯೋಜನೆ ಸಿಮ್ಯುಲೇಶನ್ (Deployment simulation) ಸಂಪೂರ್ಣ ಪರಿಸ್ಥಿತಿಯನ್ನು ಪರೀಕ್ಷಿಸುತ್ತದೆ. ನೀವು ಹೀಗೆ ಕೇಳುತ್ತೀರಿ: "ಈ ಬಳಕೆದಾರನು ಈ ಒತ್ತಡದ ಸಂದರ್ಭದಲ್ಲಿ ಈ ಸಾಧನವನ್ನು ಬಳಸಿದಾಗ ಏನಾಗುತ್ತದೆ?"
ಇದನ್ನು ಮಾಡಲು ನಿಮಗೆ ಬೃಹತ್ ಪ್ರಯೋಗಾಲಯದ ಅಗತ್ಯವಿಲ್ಲ. ನೀವು ಸಣ್ಣ ಮಟ್ಟದಲ್ಲಿ ಪ್ರಾರಂಭಿಸಬಹುದು.
ನಿಮ್ಮ AI ಉತ್ಪನ್ನಗಳಿಗಾಗಿ ಈ ಹಂತಗಳನ್ನು ಬಳಸಿ:
- ಕೇವಲ ಏಕೈಕ ಪ್ರಾಂಪ್ಟ್ಗಳಿಗಾಗಿ ಅಲ್ಲದೆ, ನೈಜ ಬಳಕೆದಾರರ ಕೆಲಸಗಳ ಸುತ್ತ ಪರೀಕ್ಷೆಗಳನ್ನು ಬರೆಯಿರಿ.
- ನಿಮ್ಮ ಪರೀಕ್ಷೆಗಳಲ್ಲಿ ಫೈಲ್ ಬರೆಯುವಿಕೆ, ಇಮೇಲ್ಗಳು ಅಥವಾ ಪಾವತಿಗಳಂತಹ ಸಾಧನಗಳ ಪ್ರವೇಶವನ್ನು ಸೇರಿಸಿ.
- ತಪ್ಪುಗಳು ಅಥವಾ ಸಂದರ್ಭದ ಕೊರತೆಯಿಂದ AI ಹೇಗೆ ಚೇತರಿಸಿಕೊಳ್ಳುತ್ತದೆ ಎಂಬುದನ್ನು ಪರೀಕ್ಷಿಸಿ.
- ನಿಮ್ಮ ನಿರ್ದಿಷ್ಟ ಉತ್ಪನ್ನಕ್ಕೆ ಹೊಂದಿಕೆಯಾಗುವ ಅಡ್ವರ್ಸರಿಯಲ್ ಉದಾಹರಣೆಗಳನ್ನು (adversarial examples) ಬಳಸಿ.
- ತಪ್ಪಿಹೋದ ಅಥವಾ ಅಪಾಯದ ಹತ್ತಿರದಲ್ಲಿದ್ದ ಘಟನೆಗಳನ್ನು (near misses) ದಾಖಲಿಸಿ ಮತ್ತು ಅವುಗಳನ್ನು ಹೊಸ ಪರೀಕ್ಷೆಗಳನ್ನಾಗಿ ಪರಿವರ್ತಿಸಿ.
ಇದು AI ಏಜೆಂಟ್ಗಳಿಗೆ ಅತ್ಯಗತ್ಯ. ಚಾಟ್ಬಾಟ್ ಪಠ್ಯದಲ್ಲಿ ತಪ್ಪುಗಳನ್ನು ಮಾಡುತ್ತದೆ. ಏಜೆಂಟ್ ಕ್ರಮಗಳನ್ನು ತೆಗೆದುಕೊಳ್ಳುವಾಗ (taking action) ತಪ್ಪುಗಳನ್ನು ಮಾಡುತ್ತದೆ. ಇದು ನಿಮ್ಮ ಅಪಾಯದ ಮಟ್ಟವನ್ನು ಬದಲಾಯಿಸುತ್ತದೆ.
ವಿಶ್ವಾಸಾರ್ಹ ವ್ಯವಸ್ಥೆಯನ್ನು ನಿರ್ಮಿಸಲು, ಈ ಚೌಕಟ್ಟನ್ನು (framework) ಅನುಸರಿಸಿ:
- ಅಪಾಯಕಾರಿ ಕ್ರಿಯಾಪದಗಳ ಪಟ್ಟಿಯನ್ನು ಮಾಡಿ: ಡಿಲೀಟ್ ಮಾಡು, ಕಳುಹಿಸು, ಪ್ರಕಟಿಸು, ಚಾರ್ಜ್ ಮಾಡು ಅಥವಾ ಅನುಮೋದಿಸು.
- ಪಾತ್ರ ಆಧಾರಿತ ಸನ್ನಿವೇಶಗಳನ್ನು ರಚಿಸಿ: ಒಬ್ಬ ಆರಂಭಿಕ (beginner), ಒಬ್ಬ ಪವರ್ ಯೂಸರ್ ಮತ್ತು ಒಬ್ಬ ದುರುದ್ದೇಶಪೂರಿತ ಬಳಕೆದಾರರನ್ನು (malicious user) ಪರೀಕ್ಷಿಸಿ.
- ಗೊಂದಲಮಯ ಸಂದರ್ಭವನ್ನು ಬಳಸಿ: AI ಗೆ ಹಳೆಯ ಡೇಟಾ ಅಥವಾ ಪರಸ್ಪರ ವಿರೋಧಾಭಾಸವಿರುವ ಸೂಚನೆಗಳನ್ನು ನೀಡಿ.
- ಕಠಿಣ ನಿರ್ಬಂಧಗಳನ್ನು (hard stops) ಸೇರಿಸಿ: ಬದಲಾಯಿಸಲಾಗದ ಕ್ರಮಗಳನ್ನು ತೆಗೆದುಕೊಳ್ಳುವ ಮೊದಲು ಮಾನವ ವಿಮರ್ಶೆಯನ್ನು (human review) ಕಡ್ಡಾಯಗೊಳಿಸಿ.
- ಸಾಮಾನ್ಯ ವಿಶ್ವಾಸಾರ್ಹತೆಯನ್ನು ಪತ್ತೆಹಚ್ಚಿ: ಮಾಡೆಲ್ ಅನಿಶ್ಚಿತತೆಯನ್ನು ಹೇಗೆ ನಿಭಾಯಿಸುತ್ತದೆ ಎಂಬುದನ್ನು ಅಳೆಯಿರಿ.
ಗುರಿ AI ಅನ್ನು ಹೆದರಿಕೆ ಸ್ವಭಾವದನ್ನಾಗಿ ಮಾಡುವುದಲ್ಲ. ಗುರಿ ಅದನ್ನು ಮುನ್ಸೂಚಿಸಬಹುದಾದ (predictable) ರೀತಿಯನ್ನಾಗಿ ಮಾಡುವುದು.
ಯಾವುದೇ ಸಿಮ್ಯುಲೇಶನ್ ಪರಿಪೂರ್ಣವಾಗಿರುವುದಿಲ್ಲ. ನೀವು ಊಹಿಸದ ದಾರಿಗಳನ್ನು ಬಳಕೆದಾರರು ಯಾವಾಗಲೂ ಕಂಡುಕೊಳ್ಳುತ್ತಾರೆ. ನಿಮಗೆ ವಿವಿಧ ಹಂತಗಳು ಬೇಕು: ಸಿಮ್ಯುಲೇಶನ್ಗಳು, ಸೀಮಿತ ರೋಲ್ಔಟ್ಗಳು (limited rollouts), ಮೇಲ್ವಿಚಾರಣೆ ಮತ್ತು ವೇಗದ ರೋಲ್ಬ್ಯಾಕ್ ಮಾರ್ಗಗಳು (rollback paths).
ಮಾಡೆಲ್ ಮೌಲ್ಯಮಾಪನವು ಸಾಫ್ಟ್ವೇರ್ ಎಂಜಿನಿಯರಿಂಗ್ನಂತಾಗುತ್ತಿದೆ. ಇದು ಸನ್ನಿವೇಶ ಆಧಾರಿತವಾಗಿರಬೇಕು ಮತ್ತು ಕೆಲಸದ ಹರಿವಿನ ಬಗ್ಗೆ ಅರಿವು ಹೊಂದಿರಬೇಕು.
ನಿಮಗೆ ಸಂಶೋಧನಾ ಪ್ರಯೋಗಾಲಯದ ಅಗತ್ಯವಿಲ್ಲ. ನಿಮಗೆ ನೈಜ ಬಳಕೆದಾರರ ಕೆಲಸಗಳು ಮತ್ತು AI ಅನ್ನು ಕೇವಲ ಪಠ್ಯ ಜನರೇಟರ್ ಆಗಿ ಅಲ್ಲದೆ, ಒಬ್ಬ ನಟನಂತೆ (actor) ಪರೀಕ್ಷಿಸುವ ಶಿಸ್ತು ಬೇಕು.
ಮೂಲ: https://dev.to/jenueldev/pre-launch-ai-simulations-are-becoming-the-new-model-safety-check-107e
ಐಚ್ಛಿಕ ಕಲಿಕಾ ಸಮುದಾಯ: https://t.me/GyaanSetuAi