ਅਮਰੀਕੀ ਸਰਕਾਰ ਦੀ ਪਾਬੰਦੀ ਤੋਂ ਬਾਅਦ Anthropic ਨੇ Fable 5 ਤੱਕ ਵਿਸ਼ਵਵਿਆਪੀ ਪਹੁੰਚ ਮੁੜ ਬਹਾਲ ਕੀਤੀ

ਅਮਰੀਕੀ ਸਰਕਾਰ ਦੁਆਰਾ ਲਗਾਈ ਗਈ ਦੋ ਹਫ਼ਤਿਆਂ ਦੀ ਮੁਅੱਤਲੀ ਤੋਂ ਬਾਅਦ, Anthropic ਨੇ ਆਪਣੇ ਸਭ ਤੋਂ ਸ਼ਕਤੀਸ਼ਾਲੀ AI ਮਾਡਲ, Fable 5 ਦੀ ਵਿਸ਼ਵਵਿਆਪੀ ਰੋਲਆਊਟ (rollout) ਨੂੰ ਅਧਿਕਾਰਤ ਤੌਰ 'ਤੇ ਮੁੜ ਸ਼ੁਰੂ ਕਰ ਦਿੱਤਾ ਹੈ। ਇਹ ਪਾਬੰਦੀ ਇੱਕ ਗੰਭੀਰ ਸੁਰੱਖਿਆ ਖੋਜ ਕਾਰਨ ਲਗਾਈ ਗਈ ਸੀ, ਜਿਸ ਵਿੱਚ ਇੱਕ ਜੇਲਬ੍ਰੇਕ (jailbreak) ਕਮਜ਼ੋਰੀ ਸ਼ਾਮਲ ਸੀ, ਜਿਸ ਨੇ ਮਾਡਲ ਨੂੰ ਨਿਰਧਾਰਤ ਸੁਰੱਖਿਆ ਗਾਰਡਰੇਲ (safety guardrails) ਨੂੰ ਬਾਈਪਾਸ ਕਰਨ ਦੀ ਇਜਾਜ਼ਤ ਦਿੱਤੀ ਸੀ।

ਕਮਜ਼ੋਰੀ: ਰੱਖਿਆਤਮਕ ਖੋਜ ਤੋਂ ਸੁਰੱਖਿਆ ਜੋਖਮ ਤੱਕ

ਇਹ ਅਚਾਨਕ ਪਾਬੰਦੀ Amazon ਦੇ ਖੋਜਕਰਤਾਵਾਂ ਦੀ ਇੱਕ ਸੁਰੱਖਿਆ ਰਿਪੋਰਟ ਕਾਰਨ ਲੱਗੀ ਸੀ, ਜਿਨ੍ਹਾਂ ਨੇ Fable 5 ਦੇ ਸੁਰੱਖਿਆ ਪ੍ਰੋਟੋਕੋਲ ਨੂੰ ਸਫਲਤਾਪੂਰਵਕ ਬਾਈਪਾਸ ਕਰ ਦਿੱਤਾ ਸੀ। ਖੋਜਕਰਤਾਵਾਂ ਨੇ ਪਾਇਆ ਕਿ ਮਾਡਲ ਖਾਸ ਸਾਫਟਵੇਅਰ ਕਮਜ਼ੋਰੀਆਂ ਦੀ ਪਛਾਣ ਕਰ ਸਕਦਾ ਹੈ ਅਤੇ ਇੱਕ ਮਹੱਤਵਪੂਰਨ ਮੌਕੇ 'ਤੇ, ਉਹਨਾਂ ਦਾ ਫਾਇਦਾ ਉਠਾਉਣ ਲਈ ਕਾਰਜਸ਼ੀਲ ਕੋਡ (functional code) ਵੀ ਤਿਆਰ ਕਰ ਸਕਦਾ ਹੈ।

ਹਾਲਾਂਕਿ Anthropic ਨੇ ਇਸ ਨੂੰ ਰੁਟੀਨ ਰੱਖਿਆਤਮਕ ਸਾਈਬਰ ਸੁਰੱਖਿਆ ਕੰਮ ਨਾਲ ਸਬੰਧਤ ਇੱਕ "ਐਜ ਕੇਸ" (edge case) ਦੱਸਿਆ, ਪਰ ਦੁਰਵਰਤੋਂ ਦੀ ਸੰਭਾਵਨਾ ਕਾਰਨ ਕੰਪਨੀ ਅਤੇ ਅਮਰੀਕੀ ਸਰਕਾਰੀ ਏਜੰਸੀਆਂ ਵਿਚਕਾਰ ਸਾਂਝੀ ਜਾਂਚ ਦੀ ਲੋੜ ਪਈ। ਦਿਲਚਸਪ ਗੱਲ ਇਹ ਹੈ ਕਿ ਜਾਂਚ ਵਿੱਚ ਸਾਹਮਣੇ ਆਇਆ ਕਿ ਇਹਨਾਂ ਖਾਮੀਆਂ ਦੀ ਪਛਾਣ ਕਰਨ ਦੀ ਯੋਗਤਾ ਸਿਰਫ਼ Fable 5 ਤੱਕ ਸੀਮਤ ਨਹੀਂ ਸੀ; Claude Opus 4.8, GPT-5.5, ਅਤੇ Kimi K2.7 ਸਮੇਤ ਹੋਰ ਮਾਡਲਾਂ ਵਿੱਚ ਵੀ ਅਜਿਹੀਆਂ ਸਮਰੱਥਾਵਾਂ ਦੇਖੀਆਂ ਗਈਆਂ। ਇੱਥੋਂ ਤੱਕ ਕਿ Claude Haiku 4.5 ਵਰਗੇ ਛੋਟੇ ਮਾਡਲਾਂ ਨੇ ਵੀ ਟੈਸਟਿੰਗ ਦੌਰਾਨ ਉਹੀ ਐਕਸਪਲੋਇਟ (exploit) ਨਤੀਜੇ ਦਿੱਤੇ।

ਨਵੇਂ ਸੁਰੱਖਿਆ ਕਲਾਸੀਫਾਇਰ ਲਾਗੂ ਕਰਨਾ ਅਤੇ "ਫਾਲਸ ਪੋਜ਼ੀਟਿਵ" ਦਾ ਸਮਝੌਤਾ

ਇਸ ਸਮੱਸਿਆ ਦੇ ਹੱਲ ਲਈ, Anthropic ਨੇ ਇੱਕ ਸੁਧਾਰਿਆ ਹੋਇਆ ਸੁਰੱਖਿਆ ਕਲਾਸੀਫਾਇਰ ਤਾਇਨਾਤ ਕੀਤਾ ਹੈ, ਜੋ Amazon ਦੀ ਰਿਪੋਰਟ ਵਿੱਚ ਪਛਾਣੀ ਗਈ ਖਾਸ ਐਕਸਪਲੋਇਟ ਤਕਨੀਕ ਨੂੰ 99% ਤੋਂ ਵੱਧ ਸ਼ੁੱਧਤਾ ਨਾਲ ਰੋਕਣ ਲਈ ਤਿਆਰ ਕੀਤਾ ਗਿਆ ਹੈ। ਜਦੋਂ ਕਿਸੇ ਉਪਭੋਗਤਾ ਦੀ ਬੇਨਤੀ ਇਸ ਨਵੇਂ ਰੱਖਿਆ ਪੱਧਰ ਨੂੰ ਟ੍ਰਿਗਰ ਕਰਦੀ ਹੈ, ਤਾਂ ਉਹਨਾਂ ਨੂੰ ਇੱਕ ਨੋਟੀਫਿਕੇਸ਼ਨ ਮਿਲਦਾ ਹੈ, ਅਤੇ ਉਹ ਸਵਾਲ ਆਪਣੇ ਆਪ ਪੁਰਾਣੇ, ਵਧੇਰੇ ਸੀਮਤ Claude Opus 4.8 ਮਾਡਲ ਵੱਲ ਰੀਰੂਟ (reroute) ਕਰ ਦਿੱਤਾ ਜਾਂਦਾ ਹੈ।

ਹਾਲਾਂਕਿ, ਇਸ ਵਧੇ ਹੋਏ ਸੁਰੱਖਿਆ ਦੇ ਨਾਲ ਕੁਝ ਕਾਰਜਸ਼ੀਲ ਨੁਕਸਾਨ ਵੀ ਆਉਂਦੇ ਹਨ। Anthropic ਨੇ ਮੰਨਿਆ ਕਿ ਨਵਾਂ ਕਲਾਸੀਫਾਇਰ ਸਟੈਂਡਰਡ ਕੋਡਿੰਗ ਅਤੇ ਡੀਬੱਗਿੰਗ (debugging) ਕੰਮਾਂ ਦੌਰਾਨ ਨੁਕਸਾਨ ਰਹਿਤ ਬੇਨਤੀਆਂ ਨੂੰ ਵੀ ਅਕਸਰ ਫਲੈਗ (flag) ਕਰ ਦਿੰਦਾ ਹੈ। ਇਹ "ਸੁਰੱਖਿਆ ਮਾਰਜਿਨ" ਮਜ਼ਬੂਤੀ ਅਤੇ ਵਰਤੋਂਯੋਗਤਾ ਵਿਚਕਾਰ ਇੱਕ ਤਣਾਅ ਪੈਦਾ ਕਰਦਾ ਹੈ—ਜੋ ਕਿ ਫਰੰਟੀਅਰ ਮਾਡਲ ਤੈਨਾਤੀ ਵਿੱਚ ਇੱਕ ਵਾਰ-ਵਾਰ ਆਉਣ ਵਾਲੀ ਚੁਣੌਤੀ ਹੈ, ਜਿੱਥੇ ਖ਼ਤਰਨਾਕ ਆਉਟਪੁੱਟ ਨੂੰ ਰੋਕਣ ਨਾਲ ਅਕਸਰ ਜਾਇਜ਼ ਡਿਵੈਲਪਰ ਬੇਨਤੀਆਂ ਦੇ "ਮਨ੍ਹਾ" (refusals) ਹੋਣ ਦੀ ਦਰ ਵਧ ਜਾਂਦੀ ਹੈ।

ਉਦਯੋਗਿਕ ਮਿਆਰਾਂ ਅਤੇ ਸਰਕਾਰੀ ਨਿਗਰਾਨੀ ਲਈ ਇੱਕ ਜ਼ੋਰ

Fable 5 ਦੀ ਘਟਨਾ ਨੇ ਰਸਮੀ, ਉਦਯੋਗ-ਵਿਆਪੀ ਸੁਰੱਖਿਆ ਮਿਆਰਾਂ ਲਈ Anthropic ਦੇ ਯਤਨਾਂ ਨੂੰ ਤੇਜ਼ ਕਰ ਦਿੱਤਾ ਹੈ। ਕੰਪਨੀ ਇਸ ਸਮੇਂ "Glasswing" ਪ੍ਰੋਗਰਾਮ ਰਾਹੀਂ Amazon, Microsoft, ਅਤੇ Google ਨਾਲ ਮਿਲ ਕੇ ਜੇਲਬ੍ਰੇਕਸ ਦੀ ਰੇਟਿੰਗ ਕਰਨ ਅਤੇ ਮਿਆਰੀ ਉਪਾਅ ਕਰਨ ਲਈ ਇੱਕ ਫਰੇਮਵਰਕ ਬਣਾਉਣ ਲਈ ਸਹਿਯੋਗ ਕਰ ਰਹੀ ਹੈ। ਇਸ ਨੂੰ ਮਜ਼ਬੂਤ ਕਰਨ ਲਈ, Anthropic ਨੇ ਇੱਕ ਸਮਰਪਿਤ 24/7 ਨਿਗਰਾਨੀ ਟੀਮ ਅਤੇ ਇੱਕ ਨਵਾਂ HackerOne ਪ੍ਰੋਗਰਾਮ ਸ਼ੁਰੂ ਕੀਤਾ ਹੈ ਤਾਂ ਜੋ ਸੁਰੱਖਿਆ ਖੋਜਕਰਤਾਵਾਂ ਨੂੰ ਸਾਈਬਰ-ਸਬੰਧਤ ਜੇਲਬ੍ਰੇਕਸ ਦੀ ਰਿਪੋਰਟ ਕਰਨ ਲਈ ਉਤਸ਼ਾਹਿਤ ਕੀਤਾ ਜਾ ਸਕੇ।

ਇਸ ਤੋਂ ਇਲਾਵਾ, Anthropic ਸਾਰੇ ਫਰੰਟੀਅਰ ਮਾਡਲ ਡਿਵੈਲਪਰਾਂ 'ਤੇ ਬਰਾਬਰ ਲਾਗੂ ਹੋਣ ਵਾਲੇ "ਮਜ਼ਬੂਤ ਨਿਯਮਾਂ" (strong regulation) ਦੀ ਵਕਾਲਤ ਕਰ ਰਿਹਾ ਹੈ। ਸਰਕਾਰੀ ਭਾਈਵਾਲਾਂ ਨੂੰ ਸੁਰੱਖਿਆ-ਸੰਵੇਦਨਸ਼ੀਲ ਮਾਡਲਾਂ ਤੱਕ ਰਿਲੀਜ਼ ਤੋਂ ਪਹਿਲਾਂ ਪਹੁੰਚ ਪ੍ਰਦਾਨ ਕਰਕੇ ਅਤੇ ਸਾਂਝੀ ਖੋਜ ਲਈ ਮਹੱਤਵਪੂਰਨ ਕੰਪਿਊਟ (compute) ਸਮਰਪਿਤ ਕਰਕੇ, Anthropic ਆਪਣੇ ਆਪ ਨੂੰ ਪਾਰਦਰਸ਼ੀ, ਸਰਕਾਰ-ਅਨੁਕੂਲ AI ਨਿਗਰਾਨੀ ਦੀ ਲਹਿਰ ਵਿੱਚ ਇੱਕ ਲੀਡਰ ਵਜੋਂ ਸਥਾਪਿਤ ਕਰ ਰਿਹਾ ਹੈ।

ਮੁੱਖ ਗੱਲਾਂ

  • ਪਹੁੰਚ ਮੁੜ ਬਹਾਲ: Fable 5 ਹੁਣ Claude.ai, Claude Code, ਅਤੇ Claude Cowork ਰਾਹੀਂ ਦੁਬਾਰਾ ਉਪਲਬਧ ਹੈ, ਜਿਸ ਵਿੱਚ Pro, Max, ਅਤੇ Team ਪਲਾਨਾਂ ਨੂੰ 7 ਜੁਲਾਈ ਤੱਕ ਪਹੁੰਚ ਮਿਲੇਗੀ।
  • ਨਵੇਂ ਰੱਖਿਆ ਪੱਧਰ: Anthropic ਨੇ ਇੱਕ ਸੁਰੱਖਿਆ ਕਲਾਸੀਫਾਇਰ ਲਾਗੂ ਕੀਤਾ ਹੈ ਜੋ ਪਛਾਣੀ ਗਈ ਐਕਸਪਲੋਇਟ ਤਕਨੀਕ ਦੇ 99% ਹਿੱਸੇ ਨੂੰ ਰੋਕਦਾ ਹੈ, ਹਾਲਾਂਕਿ ਇਹ ਕੋਡਿੰਗ ਵਰਕਫਲੋ ਵਿੱਚ ਫਾਲਸ ਪੋਜ਼ੀਟਿਵ (false positives) ਵਧਾ ਸਕਦਾ ਹੈ।
  • ਸਹਿਯੋਗੀ ਸੁਰੱਖਿਆ: Anthropic ਫਰੰਟੀਅਰ ਮਾਡਲ ਜੇਲਬ੍ਰੇਕਸ ਦੀ ਨਿਗਰਾਨੀ ਕਰਨ ਅਤੇ ਉਹਨਾਂ ਦਾ ਜਵਾਬ ਦੇਣ ਲਈ ਸਾਂਝੇ ਉਦਯੋਗਿਕ ਮਿਆਰ ਸਥਾਪਤ ਕਰਨ ਲਈ ਪ੍ਰਮੁੱਖ ਤਕਨੀਕੀ ਕੰਪਨੀਆਂ ਅਤੇ ਅਮਰੀਕੀ ਸਰਕਾਰ ਨਾਲ ਭਾਈਵਾਲੀ ਕਰ ਰਿਹਾ ਹੈ।