𝟳 𝗚𝘂𝗮𝗿𝗱𝗿𝗮𝗶𝗹𝘀 𝗧𝗵𝗮𝘁 𝗦𝘁𝗼𝗽 𝗬𝗼𝘂𝗿 𝗟𝗟𝗠 𝗙𝗿𝗼𝗺 𝗚𝗼𝗶𝗻𝗴 𝗥𝗼𝗴𝘂𝗲 ನಿಮ್ಮ LLM ನಿಯಂತ್ರಣ ತಪ್ಪದಂತೆ ತಡೆಯುವ 7 ಗಾರ್ಡ್ರೈಲ್ಗಳು
NIST ನಿರ್ಣಾಯಕ ಮೂಲಸೌಕರ್ಯಗಳಿಗಾಗಿ AI ಅಪಾಯ ನಿರ್ವಹಣೆಯ ಕುರಿತು ಹೊಸ ಟಿಪ್ಪಣಿಯನ್ನು ಬಿಡುಗಡೆ ಮಾಡಿದೆ.
AI ವ್ಯವಸ್ಥೆಗಳು ಪರೀಕ್ಷಿಸಲ್ಪಟ್ಟ ಮತ್ತು ದೃಢೀಕರಿಸಲ್ಪಟ್ಟ ರಕ್ಷಣಾತ್ಮಕ ಕ್ರಮಗಳನ್ನು ಹೊಂದಿರಬೇಕೆಂದು ಅವರು ಬಯಸುತ್ತಾರೆ. ಪ್ರಾಂಪ್ಟ್ ಇಂಜೆಕ್ಷನ್ (prompt injection) ನಂತಹ ದಾಳಿಗಳನ್ನು ತಡೆಯಲು ಡೆವಲಪರ್ಗಳು ಈ ರಕ್ಷಣಾತ್ಮಕ ಕ್ರಮಗಳನ್ನು ನಿರ್ಮಿಸಬೇಕು.
ಭದ್ರತೆಗೆ ಕೇವಲ ಒಳ್ಳೆಯ ಉದ್ದೇಶಗಳಿಗಿಂತ ಹೆಚ್ಚಿನದರ ಅಗತ್ಯವಿದೆ. ಇದಕ್ಕೆ ಪ್ರೋಗ್ರಾಮ್ಯಾಟಿಕ್ ಗಾರ್ಡ್ರೈಲ್ಗಳ ಅಗತ್ಯವಿದೆ.
ನಿಮ್ಮ AI ಅನ್ನು ಸುರಕ್ಷಿತಗೊಳಿಸಲು ಇಲ್ಲಿವೆ 7 ತಂತ್ರಗಳು:
ಇನ್ಪುಟ್ ವ್ಯಾಲಿಡೇಶನ್ (Input validation) ಬಳಕೆದಾರರ ಪಠ್ಯವು ಮಾಡೆಲ್ಗೆ ತಲುಪುವ ಮೊದಲು ಅದನ್ನು ಪರಿಶೀಲಿಸಿ. ಹಾನಿಕಾರಕ ಕೋಡ್ ಅಥವಾ ಅನಿರೀಕ್ಷಿತ HTML ಟ್ಯಾಗ್ಗಳನ್ನು ತೆಗೆದುಹಾಕಿ. ದಾಳಿಕಾರರಿಗಿಂತ ಒಂದು ಹೆಜ್ಜೆ ಮುಂದೆ ಇರಲು ಈ ನಿಯಮಗಳನ್ನು ಆಗಾಗ್ಗೆ ಅಪ್ಡೇಟ್ ಮಾಡಿ.
ಔಟ್ಪುಟ್ ಫಿಲ್ಟರಿಂಗ್ (Output filtering) ಬಳಕೆದಾರರು ನೋಡುವ ಮೊದಲು AI ಪ್ರತಿಕ್ರಿಯೆಗಳನ್ನು ಪರೀಕ್ಷಿಸಿ. ಹಾನಿಕಾರಕ ವಿಷಯವನ್ನು ತಡೆಯಲು ಕೀವರ್ಡ್ ಪಟ್ಟಿಗಳು ಅಥವಾ ಪ್ಯಾಟರ್ನ್ ಮ್ಯಾಚಿಂಗ್ ಬಳಸಿ. Pydantic ನಂತಹ ಪರಿಕರಗಳು ಔಟ್ಪುಟ್ ನಿಗದಿತ ರಚನೆಯನ್ನು ಅನುಸರಿಸುವುದನ್ನು ಖಚಿತಪಡಿಸಿಕೊಳ್ಳಲು ಸಹಾಯ ಮಾಡುತ್ತವೆ.
ಸ್ಟ್ರಕ್ಚರ್ಡ್ ಪ್ರಾಂಪ್ಟಿಂಗ್ (Structured prompting) ಸಿಸ್ಟಮ್ ಪ್ರಾಂಪ್ಟ್ಗಳು ಮತ್ತು ಸ್ಪಷ್ಟವಾದ ಡಿಲಿಮಿಟರ್ಗಳನ್ನು ಬಳಸಿ. ಬಳಕೆದಾರರ ಪ್ರಶ್ನೆಗಳನ್ನು ###User Input### ನಂತಹ ನಿರ್ದಿಷ್ಟ ಟೋಕನ್ಗಳಲ್ಲಿ ಸುತ್ತುವರಿಯಿರಿ. ಇದು ನಿಮ್ಮ ಸೂಚನೆಗಳು ಮತ್ತು ಬಳಕೆದಾರರ ಡೇಟಾ ನಡುವಿನ ವ್ಯತ್ಯಾಸವನ್ನು ಗುರುತಿಸಲು ಮಾಡೆಲ್ಗೆ ಸಹಾಯ ಮಾಡುತ್ತದೆ.
ಅಡ್ವರ್ಸರಿಯಲ್ ಟ್ರೈನಿಂಗ್ (Adversarial training) ದಾಳಿಗಳ ಉದಾಹರಣೆಗಳನ್ನು ಬಳಸಿ ನಿಮ್ಮ ಮಾಡೆಲ್ ಅನ್ನು ತರಬೇತಿಗೊಳಿಸಿ. ಇದು ಹಾನಿಕಾರಕ ಪ್ರಾಂಪ್ಟ್ಗಳನ್ನು ಗುರುತಿಸಲು ಮತ್ತು ತಿರಸ್ಕರಿಸಲು ಮಾಡೆಲ್ಗೆ ಕಲಿಸುತ್ತದೆ. ಸುರಕ್ಷತೆಯನ್ನು ಸುಧಾರಿಸಲು ನೀವು ಉತ್ತಮ ಗುಣಮಟ್ಟದ, ನಿರ್ದಿಷ್ಟ ಡೇಟಾವನ್ನು ಬಳಸಿ ಮಾಡೆಲ್ಗಳನ್ನು ಫೈನ್-ಟ್ಯೂನ್ (fine-tune) ಮಾಡಬಹುದು.
ರಿಯಲ್-ಟೈಮ್ ಮಾನಿಟರಿಂಗ್ (Real-time monitoring) ನಿಮ್ಮ ಸಿಸ್ಟಮ್ ಲಾಗ್ಗಳು ಮತ್ತು ಬಳಕೆಯ ಮಾದರಿಗಳನ್ನು ನಿರಂತರವಾಗಿ ಗಮನಿಸಿ. ವಿಲಕ್ಷಣ ನಡವಳಿಕೆಯನ್ನು ಗುರುತಿಸಲು ಅನಾಮಲಿ ಡಿಟೆಕ್ಷನ್ (anomaly detection) ಬಳಸಿ. ಇದು ಬೆದರಿಕೆಗಳು ಹೆಚ್ಚಾಗುವ ಮೊದಲು ಪ್ರತಿಕ್ರಿಯಿಸಲು ನಿಮಗೆ ಸಹಾಯ ಮಾಡುತ್ತದೆ.
ರೆಡ್ ಟೀಮಿಂಗ್ (Red teaming) ನೈಜ ಪ್ರಪಂಚದ ದಾಳಿಗಳನ್ನು ಅನುಕರಿಸಲು ತಂಡಗಳನ್ನು ನೇಮಿಸಿಕೊಳ್ಳಿ. ಹ್ಯಾಕರ್ಗಳಿಗಿಂತ ಮೊದಲೇ ಅವರು ದೋಷಗಳನ್ನು ಮತ್ತು ಪ್ರಾಂಪ್ಟ್ ಇಂಜೆಕ್ಷನ್ ವೆಕ್ಟರ್ಗಳನ್ನು ಪತ್ತೆಹಚ್ಚುತ್ತಾರೆ. ಇದು AI-ನಿರ್ದಿಷ್ಟ ಬೆದರಿಕೆಗಳ ಮೇಲೆ ಗಮನ ಕೇಂದ್ರೀಕರಿಸುವ ಮೂಲಕ ಸಾಮಾನ್ಯ ಪರೀಕ್ಷೆಗಿಂತ ಹೆಚ್ಚಿನದನ್ನು ಮಾಡುತ್ತದೆ.
ಹ್ಯೂಮನ್-ಇನ್-ದಿ-ಲೂಪ್ (Human-in-the-loop) ಒಬ್ಬ ವ್ಯಕ್ತಿಯು ಕ್ರಮಗಳನ್ನು ಪರಿಶೀಲಿಸಬೇಕಾದ ಅಥವಾ ಅನುಮೋದಿಸಬೇಕಾದ ಚೆಕ್ಪಾಯಿಂಟ್ಗಳನ್ನು ನಿರ್ಮಿಸಿ. ಇದು ಹೆಚ್ಚಿನ ಅಪಾಯವಿರುವ ಕಾರ್ಯಗಳಿಗೆ ಅತ್ಯಗತ್ಯ. ತಪ್ಪುಗಳು ಹೆಚ್ಚಿನ ನಷ್ಟವನ್ನು ಉಂಟುಮಾಡುವಾಗ ಇದು ಹೊಣೆಗಾರಿಕೆಯನ್ನು ಖಚಿತಪಡಿಸುತ್ತದೆ.
ಗಾರ್ಡ್ರೈಲ್ಗಳು ಇನ್ನು ಮುಂದೆ ಐಚ್ಛಿಕವಲ್ಲ. ಅವು ಮೂಲ ಎಂಜಿನಿಯರಿಂಗ್ ಅಗತ್ಯತೆಗಳಾಗಿವೆ.
Source: https://dev.to/autonainews/7-guardrails-that-stop-your-llm-from-going-rogue-3p3p
Optional learning community: https://t.me/GyaanSetuAi