ಅಮೆರಿಕ ಸರ್ಕಾರದ ನಿಷೇಧದ ನಂತರ Fable 5 ಗೆ ಜಾಗತಿಕ ಪ್ರವೇಶವನ್ನು ಪುನಃಸ್ಥಾಪಿಸಿದ Anthropic

ಅಮೆರಿಕ ಸರ್ಕಾರವು ವಿಧಿಸಿದ ಎರಡು ವಾರಗಳ ಅಮಾನತಿನ ನಂತರ, Anthropic ತನ್ನ ಅತ್ಯಂತ ಶಕ್ತಿಯುತ AI ಮಾದರಿಯಾದ Fable 5 ಅನ್ನು ಅಧಿಕೃತವಾಗಿ ಜಾಗತಿಕ ಮಟ್ಟದಲ್ಲಿ ಬಿಡುಗಡೆ ಮಾಡಿದೆ. ಮಾದರಿಯು ನಿಗದಿಪಡಿಸಿದ ಸುರಕ್ಷತಾ ನಿಯಮಗಳನ್ನು (safety guardrails) ಮೀರಿ ಹೋಗಲು ಅನುವು ಮಾಡಿಕೊಡುವ 'ಜೈಲ್‌ಬ್ರೇಕ್' (jailbreak) ದೌರ್ಬಲ್ಯಕ್ಕೆ ಸಂಬಂಧಿಸಿದ ಗಂಭೀರ ಭದ್ರತಾ ಅಂಶವು ಕಂಡುಬಂದ ಕಾರಣ ಈ ನಿಷೇಧ ಹೇರಲಾಗಿತ್ತು.

ದೌರ್ಬಲ್ಯ: ರಕ್ಷಣಾತ್ಮಕ ಸಂಶೋಧನೆಯಿಂದ ಭದ್ರತಾ ಅಪಾಯದವರೆಗೆ

Fable 5 ನ ಸುರಕ್ಷತಾ ಪ್ರೋಟೋಕಾಲ್‌ಗಳನ್ನು ಯಶಸ್ವಿಯಾಗಿ ಮೀರಿಹೋದ Amazon ಸಂಶೋಧಕರ ಭದ್ರತಾ ವರದಿಯಿಂದ ಈ ಹಠಾತ್ ನಿರ್ಬಂಧ ಉಂಟಾಯಿತು. ಮಾದರಿಯು ನಿರ್ದಿಷ್ಟ ಸಾಫ್ಟ್‌ವೇರ್ ದೌರ್ಬಲ್ಯಗಳನ್ನು ಗುರುತಿಸಬಲ್ಲದು ಮತ್ತು ಒಂದು ಗಮನಾರ್ಹ ಸಂದರ್ಭದಲ್ಲಿ, ಅವುಗಳನ್ನು ಬಳಸಿಕೊಳ್ಳಲು (exploit) ಕಾರ್ಯಗತ ಕೋಡ್ ಅನ್ನು ರಚಿಸಬಲ್ಲದು ಎಂದು ಸಂಶೋಧಕರು ಕಂಡುಕೊಂಡರು.

Anthropic ಇದನ್ನು ದಿನನಿತ್ಯದ ರಕ್ಷಣಾತ್ಮಕ ಸೈಬರ್ ಸುರಕ್ಷತಾ ಕೆಲಸಕ್ಕೆ ಸಂಬಂಧಿಸಿದ "ಎಡ್ಜ್ ಕೇಸ್" (edge case) ಎಂದು ವಿವರಿಸಿದರೂ, ಇದರ ದುರುಪಯೋಗದ ಸಾಧ್ಯತೆಯಿಂದಾಗಿ ಕಂಪನಿ ಮತ್ತು ಅಮೆರಿಕ ಸರ್ಕಾರಿ ಏಜೆನ್ಸಿಗಳ ನಡುವೆ ಜಂಟಿ ತನಿಖೆಯ ಅಗತ್ಯವಿತ್ತು. ಆಸಕ್ತಿದಾಯಕ ವಿಷಯವೆಂದರೆ, ಈ ದೋಷಗಳನ್ನು ಗುರುತಿಸುವ ಸಾಮರ್ಥ್ಯವು ಕೇವಲ Fable 5 ಗೆ ಮಾತ್ರ ಸೀಮಿತವಾಗಿಲ್ಲ; Claude Opus 4.8, GPT-5.5 ಮತ್ತು Kimi K2.7 ಸೇರಿದಂತೆ ಇತರ ಮಾದರಿಗಳು ಸಹ ಇದೇ ರೀತಿಯ ಸಾಮರ್ಥ್ಯಗಳನ್ನು ಪ್ರದರ್ಶಿಸಿವೆ ಎಂದು ತನಿಖೆಯಲ್ಲಿ ತಿಳಿದುಬಂದಿದೆ. Claude Haiku 4.5 ನಂತಹ ಸಣ್ಣ ಮಾದರಿಗಳು ಸಹ ಪರೀಕ್ಷೆಯ ಸಮಯದಲ್ಲಿ ಇದೇ ರೀತಿಯ ಎಕ್ಸ್‌ಪ್ಲಾಯ್ಟ್ (exploit) ಫಲಿತಾಂಶಗಳನ್ನು ನೀಡಿದ್ದವು.

ಹೊಸ ಸುರಕ್ಷತಾ ವರ್ಗೀಕರಣಕಾರಗಳ (Safety Classifiers) ಅನುಷ್ಠಾನ ಮತ್ತು "ಫಾಲ್ಸ್ ಪಾಸಿಟಿವ್" (False Positive) ಹೊಂದಾಣಿಕೆ

ಈ ಸಮಸ್ಯೆಯನ್ನು ಸರಿಪಡಿಸಲು, Amazon ವರದಿಯಲ್ಲಿ ಗುರುತಿಸಲಾದ ನಿರ್ದಿಷ್ಟ ಎಕ್ಸ್‌ಪ್ಲಾಯ್ಟ್ ತಂತ್ರವನ್ನು 99% ಕ್ಕಿಂತ ಹೆಚ್ಚು ನಿಖರತೆಯೊಂದಿಗೆ ತಡೆಯಲು ವಿನ್ಯಾಸಗೊಳಿಸಲಾದ ಸುಧಾರಿತ ಸುರಕ್ಷತಾ ವರ್ಗೀಕರಣಕಾರವನ್ನು (safety classifier) Anthropic ಅಳವಡಿಸಿದೆ. ಬಳಕೆದಾರರ ವಿನಂತಿಯು ಈ ಹೊಸ ರಕ್ಷಣಾತ್ಮಕ ಹಂತವನ್ನು ಪ್ರಚೋದಿಸಿದಾಗ, ಅವರಿಗೆ ಅಧಿಸೂಚನೆ ಸಿಗುತ್ತದೆ ಮತ್ತು ಆ ಪ್ರಶ್ನೆಯನ್ನು ಸ್ವಯಂಚಾಲಿತವಾಗಿ ಹಳೆಯದಾದ ಮತ್ತು ಹೆಚ್ಚು ನಿರ್ಬಂಧಿತವಾದ Claude Opus 4.8 ಮಾದರಿಗೆ ವರ್ಗಾಯಿಸಲಾಗುತ್ತದೆ.

ಆದಾಗ್ಯೂ, ಈ ಸುಧಾರಿತ ಭದ್ರತೆಯು ಕಾರ್ಯಕ್ಷಮತೆಯ ಮೇಲೆ ಪರಿಣಾಮ ಬೀರುತ್ತದೆ. ಸಾಮಾನ್ಯ ಕೋಡಿಂಗ್ ಮತ್ತು ಡಿಬಗ್ಗಿಂಗ್ (debugging) ಕಾರ್ಯಗಳ ಸಮಯದಲ್ಲಿ ಹೊಸ ವರ್ಗೀಕರಣಕಾರವು ಹಾನಿಕಾರಕವಲ್ಲದ ವಿನಂತಿಗಳನ್ನು ಸಹ ಪದೇ ಪದೇ ಗುರುತಿಸುತ್ತದೆ ಎಂದು Anthropic ಒಪ್ಪಿಕೊಂಡಿದೆ. ಈ "ಸುರಕ್ಷತಾ ಮಾರ್ಜಿನ್" (safety margin) ದೃಢತೆ ಮತ್ತು ಬಳಕೆಯ ಸುಲಭತೆಯ ನಡುವೆ ಸಂಘರ್ಷವನ್ನು ಉಂಟುಮಾಡುತ್ತದೆ—ಇದು ಫ್ರಾಂಟಿಯರ್ ಮಾದರಿಗಳ (frontier models) ನಿಯೋಜನೆಯಲ್ಲಿ ಎದುರಾಗುವ ಸಾಮಾನ್ಯ ಸವಾಲಾಗಿದೆ, ಇಲ್ಲಿ ಅಪಾಯಕಾರಿ ಫಲಿತಾಂಶಗಳನ್ನು ತಡೆಯುವುದು ಹೆಚ್ಚಾಗಿ ಕಾನೂನುಬದ್ಧ ಡೆವಲಪರ್ ಪ್ರಶ್ನೆಗಳ "ತಿರಸ್ಕಾರಕ್ಕೆ" (refusals) ಕಾರಣವಾಗುತ್ತದೆ.

ಉದ್ಯಮದ ಮಾನದಂಡಗಳು ಮತ್ತು ಸರ್ಕಾರದ ಮೇಲ್ವಿಚಾರಣೆಗೆ ಒತ್ತು

Fable 5 ಘಟನೆಯು ಔಪಚಾರಿಕವಾದ, ಉದ್ಯಮದಾದ್ಯಂತ ಇರುವ ಸುರಕ್ಷತಾ ಮಾನದಂಡಗಳಿಗಾಗಿ Anthropic ನೀಡುತ್ತಿರುವ ಒತ್ತಡವನ್ನು ವೇಗಗೊಳಿಸಿದೆ. ಜೈಲ್‌ಬ್ರೇಕ್‌ಗಳನ್ನು ರೇಟ್ ಮಾಡಲು ಮತ್ತು ಪ್ರಮಾಣೀಕೃತ ಪ್ರತಿರೋಧ ಕ್ರಮಗಳನ್ನು (countermeasures) ಪ್ರಚೋದಿಸಲು ಒಂದು ಚೌಕಟ್ಟನ್ನು ನಿರ್ಮಿಸಲು ಕಂಪನಿಯು ಪ್ರಸ್ತುತ "Glasswing" ಕಾರ್ಯಕ್ರಮದ ಮೂಲಕ Amazon, Microsoft ಮತ್ತು Google ನೊಂದಿಗೆ ಸಹಕರಿಸುತ್ತಿದೆ. ಇದನ್ನು ಬಲಪಡಿಸಲು, Anthropic ಸೈಬರ್ ಸಂಬಂಧಿತ ಜೈಲ್‌ಬ್ರೇಕ್‌ಗಳನ್ನು ವರದಿ ಮಾಡಲು ಭದ್ರತಾ ಸಂಶೋಧಕರಿಗೆ ಪ್ರೋತ್ಸಾಹ ನೀಡಲು ಮೀಸಲಾದ 24/7 ಮೇಲ್ವಿಚಾರಣಾ ತಂಡ ಮತ್ತು ಹೊಸ HackerOne ಕಾರ್ಯಕ್ರಮವನ್ನು ಪ್ರಾರಂಭಿಸಿದೆ.

ಇದಲ್ಲದೆ, ಎಲ್ಲಾ ಫ್ರಾಂಟಿಯರ್ ಮಾದರಿ ಅಭಿವೃದ್ಧಿಪಡಿಸುವವರಿಗೂ ಸಮಾನವಾಗಿ ಅನ್ವಯಿಸುವ "ಬಲವಾದ ನಿಯಂತ್ರಣಕ್ಕಾಗಿ" (strong regulation) Anthropic ವಾದಿಸುತ್ತಿದೆ. ಸರ್ಕಾರಿ ಪಾಲುದಾರರಿಗೆ ಭದ್ರತಾ-ಸೂಕ್ಷ್ಮ ಮಾದರಿಗಳ ಮುನ್ನಾ 미리 (pre-release) ಪ್ರವೇಶವನ್ನು ನೀಡುವುದರ ಮೂಲಕ ಮತ್ತು ಜಂಟಿ ಸಂಶೋಧನೆಗಾಗಿ ಗಣನೀಯ ಕಂಪ್ಯೂಟ್ (compute) ಶಕ್ತಿಯನ್ನು ಮೀಸಲಿಡುವುದರ ಮೂಲಕ, ಪಾರದರ್ಶಕ ಮತ್ತು ಸರ್ಕಾರಕ್ಕೆ ಅನುಗುಣವಾದ AI ಮೇಲ್ವಿಚಾರಣೆಯ ಚಳುವಳಿಯಲ್ಲಿ Anthropic ತನ್ನನ್ನು ನಾಯಕನನ್ನಾಗಿ ರೂಪಿಸಿಕೊಳ್ಳುತ್ತಿದೆ.

ಪ್ರಮುಖ ಅಂಶಗಳು

  • ಪುನಃಸ್ಥಾಪಿತ ಪ್ರವೇಶ: Fable 5 ಈಗ Claude.ai, Claude Code ಮತ್ತು Claude Cowork ಮೂಲಕ ಮತ್ತೆ ಲಭ್ಯವಿದೆ; Pro, Max ಮತ್ತು Team ಯೋಜನೆಗಳು ಜುಲೈ 7 ರವರೆಗೆ ಪ್ರವೇಶವನ್ನು ಪಡೆಯುತ್ತವೆ.
  • ಹೊಸ ರಕ್ಷಣಾತ್ಮಕ ಹಂತಗಳು: Anthropic ಗುರುತಿಸಲಾದ ಎಕ್ಸ್‌ಪ್ಲಾಯ್ಟ್ ತಂತ್ರದ 99% ಅನ್ನು ತಡೆಯುವ ಸುರಕ್ಷತಾ ವರ್ಗೀಕರಣಕಾರವನ್ನು ಜಾರಿಗೆ ತಂದಿದೆ, ಆದರೆ ಇದು ಕೋಡಿಂಗ್ ಕೆಲಸದ ಹರಿವಿನಲ್ಲಿ (workflows) ಫಾಲ್ಸ್ ಪಾಸಿಟಿವ್‌ಗಳನ್ನು ಹೆಚ್ಚಿಸಬಹುದು.
  • ಸಹಕಾರಿ ಭದ್ರತೆ: ಫ್ರಾಂಟಿಯರ್ ಮಾದರಿಗಳ ಜೈಲ್‌ಬ್ರೇಕ್‌ಗಳನ್ನು ಮೇಲ್ವಿಚಾರಣೆ ಮಾಡಲು ಮತ್ತು ಪ್ರತಿಕ್ರಿಯಿಸಲು ಹಂಚಿಕೆಯ ಉದ್ಯಮ ಮಾನದಂಡಗಳನ್ನು ಸ್ಥಾಪಿಸಲು Anthropic ಪ್ರಮುಖ ತಂತ್ರಜ್ಞಾನ ಸಂಸ್ಥೆಗಳು ಮತ್ತು ಅಮೆರಿಕ ಸರ್ಕಾರದೊಂದಿಗೆ ಪಾಲುದಾರಿಕೆಯನ್ನು ಹೊಂದಿದೆ.