ਸਰਕਾਰੀ ਗੱਲਬਾਤ ਤੋਂ ਬਾਅਦ Anthropic ਨੇ Claude Fable 5 ਤੱਕ ਪਹੁੰਚ ਮੁੜ ਸੁਰਜੀਤ ਕੀਤੀ

Trump ਪ੍ਰਸ਼ਾਸਨ ਨਾਲ ਹਫ਼ਤਿਆਂ ਦੀ ਤੀਬਰ ਗੱਲਬਾਤ ਤੋਂ ਬਾਅਦ, Anthropic ਨੇ ਅਧਿਕਾਰਤ ਤੌਰ 'ਤੇ ਆਪਣੇ ਬਹੁਤ ਹੀ ਉਤਸੁਕਤਾ ਨਾਲ ਉਡੀਕ ਕੀਤੇ ਜਾ ਰਹੇ Claude Fable 5 ਮਾਡਲ ਦੀ ਵਾਪਸੀ ਨੂੰ ਹਰੀ ਝੰਡੀ ਦੇ ਦਿੱਤੀ ਹੈ। ਇਹ ਕਦਮ ਸਖ਼ਤ ਨਿਰਯਾਤ ਨਿਯੰਤਰਣਾਂ ਦੇ ਅਧਿਐਨ ਤੋਂ ਬਾਅਦ ਆਇਆ ਹੈ, ਜਿਸ ਨੇ ਉਦਯੋਗ ਦੇ ਸਭ ਤੋਂ ਮਹੱਤਵਪੂਰਨ ਉਪਭੋਗਤਾ-ਮੁਖੀ AI ਮਾਡਲਾਂ ਵਿੱਚੋਂ ਇੱਕ ਨੂੰ ਪਾਸੇ ਰੱਖ ਦਿੱਤਾ ਸੀ।

ਨਿਰਯਾਤ ਨਿਯੰਤਰਣਾਂ ਨੂੰ ਹਟਾਉਣਾ ਅਤੇ ਵਿਸ਼ਵਵਿਆਪੀ ਪਹੁੰਚ ਨੂੰ ਮੁੜ ਸੁਰਜੀਤ ਕਰਨਾ

ਵਣਜ ਵਿਭਾਗ (Department of Commerce) ਨੇ ਅਧਿਕਾਰਤ ਤੌਰ 'ਤੇ ਉਹਨਾਂ ਨਿਰਯਾਤ ਨਿਯੰਤਰਣ ਨਿਰਦੇਸ਼ਾਂ ਨੂੰ ਹਟਾ ਦਿੱਤਾ ਹੈ ਜਿਨ੍ਹਾਂ ਨੇ ਪਹਿਲਾਂ Claude Fable 5 ਅਤੇ ਇਸਦੀ ਅਧਾਰਤ ਤਕਨਾਲੋਜੀ, Mythos 5, ਦੋਵਾਂ ਤੱਕ ਪਹੁੰਚ ਨੂੰ ਸੀਮਤ ਕਰ ਦਿੱਤਾ ਸੀ। ਇਹਨਾਂ ਨਿਯੰਤਰਣਾਂ ਨੇ ਇੱਕ ਵੱਡੀ ਕਾਰਜਸ਼ੀਲ ਰੁਕਾਵਟ ਪੈਦਾ ਕੀਤੀ ਸੀ, ਜਿਸ ਨਾਲ ਵਿਦੇਸ਼ੀ ਨਾਗਰਿਕਾਂ—Anthropic ਦੇ ਆਪਣੇ ਕਈ ਅੰਤਰਰਾਸ਼ਟਰੀ ਕਰਮਚਾਰੀਆਂ ਅਤੇ ਐਂਟਰਪ੍ਰਾਈਜ਼ ਕਲਾਇੰਟ ਕੰਪਨੀਆਂ ਦੇ ਗੈਰ-ਅਮਰੀਕੀ ਮੈਂਬਰਾਂ ਸਮੇਤ—ਨੂੰ ਇਹਨਾਂ ਮਾਡਲਾਂ ਦੀ ਵਰਤੋਂ ਕਰਨ ਤੋਂ ਰੋਕ ਦਿੱਤਾ ਗਿਆ ਸੀ।

Anthropic ਨੇ ਪੁਸ਼ਟੀ ਕੀਤੀ ਹੈ ਕਿ ਉਹ ਇਸ ਬੁੱਧਵਾਰ ਤੋਂ Claude ਪਲੇਟਫਾਰਮਾਂ 'ਤੇ ਵਿਸ਼ਵਵਿਆਪੀ ਪੱਧਰ 'ਤੇ Fable 5 ਤੱਕ ਪਹੁੰਚ ਨੂੰ ਮੁੜ ਸੁਰਜੀਤ ਕਰਨਾ ਸ਼ੁਰੂ ਕਰ ਦੇਵੇਗਾ। ਹਾਲਾਂਕਿ ਕੋਈ ਖਾਸ ਸਮਾਂ-ਸੀਮਾ ਨਿਰਧਾਰਤ ਨਹੀਂ ਕੀਤੀ ਗਈ ਹੈ, ਪਰ ਕੰਪਨੀ ਨੇ ਨੇੜੇ ਦੇ ਭਵਿੱਖ ਵਿੱਚ AWS, Google Cloud, ਅਤੇ Microsoft Foundry ਸਮੇਤ ਪ੍ਰਮੁੱਖ ਕਲਾਉਡ ਇਨਫਰਾਸਟ੍ਰਕਚਰ 'ਤੇ ਮਾਡਲ ਨੂੰ ਮੁੜ ਸੁਰਚਿਤ ਕਰਨ ਦੀ ਯੋਜਨਾ ਬਣਾਈ ਹੈ।

Jailbreak ਕਮਜ਼ੋਰੀ ਦਾ ਹੱਲ ਕਰਨਾ

ਸਰਕਾਰ ਦੀ ਸ਼ੁਰੂਆਤੀ ਦਖਲਅੰਦਾਜ਼ੀ ਸੰਭਾਵੀ "jailbreaks" ਬਾਰੇ ਚਿੰਤਾਵਾਂ ਕਾਰਨ ਹੋਈ ਸੀ, ਖਾਸ ਕਰਕੇ Amazon ਦੇ ਖੋਜਕਰਤਾਵਾਂ ਦੀ ਇੱਕ ਰਿਪੋਰਟ ਤੋਂ ਬਾਅਦ ਜਿਸ ਨੇ ਇੱਕ ਕਮਜ਼ੋਰੀ ਵੱਲ ਇਸ਼ਾਰਾ ਕੀਤਾ ਸੀ। ਜਵਾਬ ਵਿੱਚ, Anthropic ਨੇ ਇੱਕ ਵਧੇਰੇ ਮਜ਼ਬੂਤ ਸੁਰੱਖਿਆ ਆਰਕੀਟੈਕਚਰ ਲਾਗੂ ਕੀਤਾ ਹੈ।

ਕੰਪਨੀ ਨੇ ਇੱਕ ਸੁਧਾਰਿਆ ਹੋਇਆ ਸੁਰੱਖਿਆ ਕਲਾਸੀਫਾਇਰ (safety classifier) ਸਿਖਲਾਈ ਦਿੱਤੀ ਹੈ ਜੋ Amazon ਰਿਪੋਰਟ ਵਿੱਚ ਪਛਾਣੀਆਂ ਗਈਆਂ ਵਿਸ਼ੇਸ਼ ਤਕਨੀਕਾਂ ਨੂੰ ਨਿਸ਼ਾਨਾ ਬਣਾਉਣ ਅਤੇ ਰੋਕਣ ਲਈ ਤਿਆਰ ਕੀਤਾ ਗਿਆ ਹੈ, ਅਤੇ ਇਸਦੀ ਸਫਲਤਾ ਦਰ 99% ਤੋਂ ਵੱਧ ਹੋਣ ਦਾ ਦਾਅਵਾ ਕੀਤਾ ਹੈ। ਇਹ ਯਕੀਨੀ ਬਣਾਉਣ ਲਈ ਕਿ ਜਦੋਂ ਕੋਈ ਬੇਨਤੀ ਰੋਕ ਦਿੱਤੀ ਜਾਂਦੀ ਹੈ ਤਾਂ ਵੀ ਉਪਭੋਗਤਾ ਅਨੁਭਵ ਨਿਰਵਿਘਨ ਰਹੇ, Anthropic ਨੇ ਇੱਕ ਫਾਲਬੈਕ ਮਕੈਨਿਜ਼ਮ (fallback mechanism) ਨੂੰ ਜੋੜਿਆ ਹੈ: ਜੇਕਰ Fable 5 ਨੂੰ ਨਵੇਂ ਕਲਾਸੀਫਾਇਰ ਦੁਆਰਾ ਫਲੈਗ ਕੀਤਾ ਜਾਂਦਾ ਹੈ, ਤਾਂ ਇਸਨੂੰ ਆਪਣੇ ਆਪ Opus 4.8 ਮਾਡਲ ਵੱਲ ਭੇਜ ਦਿੱਤਾ ਜਾਵੇਗਾ।

ਸਰਕਾਰ-AI ਸਹਿਯੋਗ ਦਾ ਇੱਕ ਨਵਾਂ ਯੁੱਗ

Fable 5 ਦੀ ਵਾਪਸੀ ਇਸ ਗੱਲ ਦਾ ਸੰਕੇਤ ਹੈ ਕਿ ਫਰੰਟੀਅਰ AI ਲੈਬਾਂ ਫੈਡਰਲ ਰੈਗੂਲੇਟਰਾਂ ਨਾਲ ਕਿਵੇਂ ਗੱਲਬਾਤ ਕਰਦੀਆਂ ਹਨ। Anthropic ਨੇ Trump ਪ੍ਰਸ਼ਾਸਨ ਨਾਲ ਨੇੜਿਓਂ ਕੰਮ ਕਰਨ ਲਈ ਇੱਕ ਸਰਗਰਮ ਰਣਨੀਤੀ ਤਿਆਰ ਕੀਤੀ ਹੈ, ਜਿਸ ਵਿੱਚ ਸ਼ਾਮਲ ਹਨ:

  • Pre-release ਸਰਕਾਰੀ ਪਹੁੰਚ: ਸਰਕਾਰੀ ਭਾਈਵਾਲਾਂ ਨੂੰ ਜਨਤਾ ਤੱਕ ਪਹੁੰਚਣ ਤੋਂ ਪਹਿਲਾਂ ਰਾਸ਼ਟਰੀ ਸੁਰੱਖਿਆ ਨਾਲ ਸਬੰਧਤ ਮਾਡਲਾਂ 'ਤੇ ਸੁਤੰਤਰ ਮੁਲਾਂਕਣ ਕਰਨ ਦੀ ਇਜਾਜ਼ਤ ਦੇਣਾ।
  • ਤੇਜ਼ ਜਾਣਕਾਰੀ ਸਾਂਝੀ ਕਰਨਾ: ਜਦੋਂ ਮਹੱਤਵਪੂਰਨ jailbreaks ਜਾਂ ਦੁਰਵਰਤੋਂ ਦੇ ਪੈਟਰਨ ਪਛਾਣੇ ਜਾਂਦੇ ਹਨ ਤਾਂ ਤੁਰੰਤ ਖੁਲਾਸਾ ਕਰਨ ਦਾ ਵਾਅਦਾ ਕਰਨਾ।
  • ਸਰੋਤ ਅਲਾਟਮੈਂਟ: ਸਰਕਾਰੀ ਟੈਸਟਿੰਗ ਅਤੇ ਖੋਜ ਦਾ ਸਮਰਥਨ ਕਰਨ ਲਈ ਸਮਰਪਿਤ ਟੀਮਾਂ ਸਥਾਪਤ ਕਰਨਾ ਅਤੇ ਮਹੱਤਵਪੂਰਨ ਕੰਪਿਊਟ ਅਲਾਟਮੈਂਟ ਪ੍ਰਦਾਨ ਕਰਨਾ।

ਇਸ ਤੋਂ ਇਲਾਵਾ, Anthropic ਆਪਣੇ Project Glasswing ਪ੍ਰੋਗਰਾਮ ਰਾਹੀਂ—Amazon, Microsoft, ਅਤੇ Google ਨਾਲ ਭਾਈਵਾਲੀ ਕਰਕੇ—ਇੱਕ ਸਵੈ-ਇੱਛਤ, ਸਾਂਝਾ ਸੁਰੱਖਿਆ ਅਤੇ ਮੁਲਾਂਕਣ ਮਿਆਰ ਸਥਾਪਤ ਕਰਨ ਲਈ ਉਦਯੋਗ-ਵਿਆਪੀ ਯਤਨ ਦੀ ਅਗਵਾਈ ਕਰ ਰਿਹਾ ਹੈ। ਇਹ ਫਰੇਮਵਰਕ ਹਮਲਾਵਰ ਦੀ ਸਮਰੱਥਾ ਪ੍ਰਾਪਤੀ, ਪ੍ਰਾਪਤੀ ਦੀ ਵਿਸ਼ਾਲਤਾ, ਹਥਿਆਰ ਬਣਾਉਣ ਦੀ ਸੌਖ, ਅਤੇ ਖੋਜਣਯੋਗਤਾ ਦੇ ਅਧਾਰ 'ਤੇ jailbreak ਦੀ ਗੰਭੀਰਤਾ ਨੂੰ ਸ਼੍ਰੇਣੀਬੱਧ ਕਰਨ ਦੀ ਕੋਸ਼ਿਸ਼ ਕਰਦਾ ਹੈ।

ਇਹ AI ਉਦਯੋਗ ਲਈ ਕਿਉਂ ਮਹੱਤਵਪੂਰਨ ਹੈ

ਇਹ ਵਿਕਾਸ AI ਦੇ ਖੇਤਰ ਲਈ ਇੱਕ ਮਹੱਤਵਪੂਰਨ ਮੋੜ ਹੈ, ਖਾਸ ਕਰਕੇ ਜਦੋਂ OpenAI ਵਰਗੀਆਂ ਕੰਪਨੀਆਂ GPT-5 ਵਰਗੇ ਮਾਡਲਾਂ ਲਈ ਅਜਿਹੇ ਹੀ ਪੜਾਅਵਾਰ ਰੋਲਆਊਟ (staggered rollouts) ਕਰ ਰਹੀਆਂ ਹਨ। ਜਿਵੇਂ ਕਿ ਉਦਯੋਗ ਉੱਨਤ ਸਾਈਬਰ ਸੁਰੱਖਿਆ ਸਮਰੱਥਾਵਾਂ ਵਾਲੇ ਵਧੇਰੇ ਸ਼ਕਤੀਸ਼ਾਲੀ ਮਾਡਲਾਂ ਵੱਲ ਵਧ ਰਿਹਾ ਹੈ, ਤੇਜ਼ ਨਵੀਨਤਾ ਅਤੇ ਰਾਸ਼ਟਰੀ ਸੁਰੱਖਿਆ ਵਿਚਕਾਰ ਤਣਾਅ ਹੋਰ ਵਧੇਗਾ। Anthropic ਦਾ "pre-release testing" ਅਤੇ "ਸਵੈ-ਇੱਛਤ ਮਿਆਰਾਂ" ਨੂੰ ਰਸਮੀ ਰੂਪ ਦੇਣ ਦਾ ਕਦਮ ਇੱਕ ਉੱਚ-ਨਿਯੰਤਰਿਤ ਮਾਹੌਲ ਵਿੱਚ ਫਰੰਟੀਅਰ ਮਾਡਲ ਪ੍ਰਦਾਤਾਵਾਂ ਦੁਆਰਾ ਆਪਣੀ ਜਾਇਜ਼ਤਾ ਬਣਾਈ ਰੱਖਣ ਲਈ ਇੱਕ ਨਮੂਨਾ (blueprint) ਬਣ ਸਕਦਾ ਹੈ।

ਮੁੱਖ ਗੱਲਾਂ

  • ਵਿਸ਼ਵਵਿਆਪੀ ਮੁੜ ਸੁਰਜੀਤੀ: Claude Fable 5 ਇਸ ਬੁੱਧਵਾਰ ਨੂੰ ਵਿਸ਼ਵਵਿਆਪੀ Claude ਪਲੇਟਫਾਰਮਾਂ 'ਤੇ ਵਾਪਸ ਆ ਰਿਹਾ ਹੈ, ਜਿਸ ਤੋਂ ਬਾਅਦ ਕਲਾਉਡ ਪ੍ਰਦਾਤਾਵਾਂ (AWS, Google, Microsoft) ਤੱਕ ਪਹੁੰਚ ਮਿਲੇਗੀ।
  • ਵਧੀ ਹੋਈ ਸੁਰੱਖਿਆ: ਇੱਕ ਨਵਾਂ ਸੁਰੱਖਿਆ ਕਲਾਸੀਫਾਇਰ ਲਾਗੂ ਕੀਤਾ ਗਿਆ ਹੈ, ਜੋ 99% ਤੋਂ ਵੱਧ ਮਾਮਲਿਆਂ ਵਿੱਚ ਪਛਾਣੀਆਂ ਗਈਆਂ jailbreak ਤਕਨੀਕਾਂ ਨੂੰ ਰੋਕ ਰਿਹਾ ਹੈ ਅਤੇ ਰੋਕੀਆਂ ਗਈਆਂ ਪੁੱਛਗਿੱਛਾਂ ਨੂੰ Opus 4.8 ਵੱਲ ਰੀਡਾਇਰੈਕਟ ਕਰ ਰਿਹਾ ਹੈ।
  • ਨਿਯਮਾਂ ਦੇ ਅਨੁਕੂਲ: Anthropic ਅਮਰੀਕੀ ਸਰਕਾਰ ਨਾਲ ਸਹਿਯੋਗੀ ਮਾਡਲ ਵੱਲ ਵਧ ਰਿਹਾ ਹੈ, ਜੋ ਕਿ pre-release ਮੁਲਾਂਕਣ ਅਤੇ ਸੁਰੱਖਿਆ ਖਤਰਿਆਂ ਬਾਰੇ ਤੇਜ਼ ਜਾਣਕਾਰੀ ਸਾਂਝੀ ਕਰਨ ਦੀ ਪੇਸ਼ਕਸ਼ ਕਰਦਾ ਹੈ।