𝗔𝗜 𝗥𝗲𝗱 𝗧𝗲𝗮𝗺𝗶𝗻𝗴: 𝗧𝗲𝘀𝘁𝗶𝗻𝗴 𝗔𝗜 𝗦𝘆𝘀𝘁𝗲𝗺𝘀 𝗟𝗶𝗸𝗲 𝗮𝗻 𝗔𝘁𝘁𝗮𝗰𝗸𝗲𝗿

ಜನರೇಟಿವ್ AI ಮತ್ತು AI ಏಜೆಂಟ್‌ಗಳು ವ್ಯವಹಾರದ ಕಾರ್ಯವಿಧಾನಗಳಲ್ಲಿ (workflows) ಪ್ರವೇಶಿಸುತ್ತಿವೆ.

ಸಾಂಪ್ರದಾಯಿಕ ಭದ್ರತಾ ಪರೀಕ್ಷೆಯು ಸಾಕಾಗುವುದಿಲ್ಲ. ಪ್ರಮಾಣಿತ ಪೆನೆಟ್ರೇಶನ್ ಪರೀಕ್ಷೆಗಳು (penetration tests) ಹೊಸ ಅಪಾಯಗಳನ್ನು ಗುರುತಿಸಲು ವಿಫಲವಾಗುತ್ತವೆ. AI ವ್ಯವಸ್ಥೆಗಳು ಪ್ರಾಂಪ್ಟ್ ಇಂಜೆಕ್ಷನ್ (prompt injection), ಜೈಲ್‌ಬ್ರೇಕ್‌ಗಳು (jailbreaks) ಮತ್ತು ಡೇಟಾ ಸೋರಿಕೆಯಂತಹ ವಿಶಿಷ್ಟ ಬೆದರಿಕೆಗಳನ್ನು ಎದುರಿಸುತ್ತವೆ.

AI ರೆಡ್ ಟೀಮಿಂಗ್ ಈ ಕೊರತೆಯನ್ನು ಸರಿಪಡಿಸುತ್ತದೆ.

ಈ ವಿಧಾನವು ದಾಳಿಗಾರನ ದೃಷ್ಟಿಕೋನದಿಂದ AI ಅನ್ನು ಪರೀಕ್ಷಿಸುತ್ತದೆ. ಮಾಡೆಲ್‌ಗಳು ದುರುದ್ದೇಶಪೂರಿತ ಪ್ರಾಂಪ್ಟ್‌ಗಳಿಗೆ ಹೇಗೆ ಪ್ರತಿಕ್ರಿಯಿಸುತ್ತವೆ ಎಂಬುದರ ಮೇಲೆ ಇದು ಗಮನಹರಿಸುತ್ತದೆ. ಮೂಲಸೌಕರ್ಯವನ್ನು (infrastructure) ಪರಿಶೀಲಿಸುವ ಬದಲು, ತಂಡಗಳು ಮಾಡೆಲ್ ನಡವಳಿಕೆಯನ್ನು ಪರೀಕ್ಷಿಸುತ್ತವೆ. ಅವರು ಸುರಕ್ಷತಾ ಕ್ರಮಗಳನ್ನು ಬೈಪಾಸ್ ಮಾಡಲು ಮತ್ತು ಖಾಸಗಿ ಡೇಟಾವನ್ನು ಹೊರತೆಗೆಯಲು ಪ್ರಯತ್ನಿಸುತ್ತಾರೆ.

AI ರೆಡ್ ಟೀಮಿಂಗ್‌ನ ಪ್ರಮುಖ ಗುರಿಗಳು ಇಂತಿವೆ:

  • ಪ್ರಾಂಪ್ಟ್ ಇಂಜೆಕ್ಷನ್‌ಗೆ ಇರುವ ಪ್ರತಿರೋಧವನ್ನು ಪರೀಕ್ಷಿಸುವುದು
  • ಡೇಟಾ ಸೋರಿಕೆಯ ಅಪಾಯಗಳನ್ನು ಕಂಡುಹಿಡಿಯುವುದು
  • ಮಾಡೆಲ್ ಸುರಕ್ಷತಾ ನಿಯಂತ್ರಣಗಳನ್ನು ಮೌಲ್ಯಮಾಪನ ಮಾಡುವುದು
  • AI ಏಜೆಂಟ್ ನಡವಳಿಕೆಯನ್ನು ಅಳೆಯುವುದು
  • ಪ್ರವೇಶ ನಿಯಂತ್ರಣಗಳನ್ನು (access controls) ದೃಢೀಕರಿಸುವುದು
  • ಪ್ರತಿಕೂಲ ಇನ್‌ಪುಟ್‌ಗಳ (adversarial inputs) ವಿರುದ್ಧದ ಸ್ಥಿತಿಸ್ಥಾಪಕತ್ವವನ್ನು ಅಳೆಯುವುದು

ಸಾಂಪ್ರದಾಯಿಕ ಪರೀಕ್ಷೆಯು ಇನ್ನೂ ಮುಖ್ಯವಾಗಿದೆ. ಆದರೆ AI ಪರಿಸರಗಳಿಗಾಗಿ ನಿಮಗೆ ನಿರ್ದಿಷ್ಟ ಪರೀಕ್ಷೆಗಳ ಅಗತ್ಯವಿದೆ.

ದಾಳಿಗಾರರು ನಿಮ್ಮ ಮಾಡೆಲ್‌ಗಳನ್ನು ಹೇಗೆ ಗುರಿಯಾಗಿಸುತ್ತಾರೆ ಎಂಬುದನ್ನು AI ರೆಡ್ ಟೀಮಿಂಗ್ ನಿಮಗೆ ತೋರಿಸುತ್ತದೆ. ನೀವು ಅಳವಡಿಸುವ (deploy) ಮೊದಲು ಉತ್ತಮ ರಕ್ಷಣೆಯನ್ನು ನಿರ್ಮಿಸಲು ಇದು ನಿಮಗೆ ಅಗತ್ಯ ಕ್ರಮಗಳನ್ನು ನೀಡುತ್ತದೆ.

ನಿಮ್ಮ ಕಂಪನಿಯು AI ಅನ್ನು ಬಳಸುತ್ತಿದ್ದರೆ, ನಿಮ್ಮ ಭದ್ರತಾ ಯೋಜನೆಯಲ್ಲಿ ರೆಡ್ ಟೀಮಿಂಗ್ ಅನ್ನು ಸೇರಿಸಿಕೊಳ್ಳಿ.

ಪೂರ್ಣ ಮಾರ್ಗದರ್ಶಿಯನ್ನು ಇಲ್ಲಿ ಓದಿ: https://dev.to/harshita_arghode_86ed38f5/ai-red-teaming-testing-ai-systems-like-an-attacker-116p

ಐಚ್ಛಿಕ ಕಲಿಕಾ ಸಮುದಾಯ: https://t.me/GyaanSetuAi