ਸਾਈਬਰ ਸੁਰੱਖਿਆ ਮਾਹਰਾਂ ਨੇ Anthropic ਦੇ Fable ਅਤੇ Mythos ਮਾਡਲਾਂ 'ਤੇ ਅਮਰੀਕੀ ਪਾਬੰਦੀ ਦਾ ਵਿਰੋਧ ਕੀਤਾ

76 ਪ੍ਰਮੁੱਖ ਸਾਈਬਰ ਸੁਰੱਖਿਆ ਮਾਹਰਾਂ ਦਾ ਇੱਕ ਗਠਜੋੜ Anthropic ਦੇ ਸਭ ਤੋਂ ਉੱਨਤ AI ਮਾਡਲਾਂ ਨੂੰ ਨਿਸ਼ਾਨਾ ਬਣਾਉਣ ਵਾਲੇ ਅਮਰੀਕੀ ਸਰਕਾਰ ਦੇ ਹਾਲੀਆ ਐਕਸਪੋਰਟ ਕੰਟਰੋਲ ਆਰਡਰ ਵਿਰੁੱਧ ਚੇਤਾਵਨੀ ਦੇ ਰਹੀ ਹੈ। ਸਮੂਹ ਦਾ ਤਰਕ ਹੈ ਕਿ ਇਹਨਾਂ ਸਾਧਨਾਂ ਤੱਕ ਪਹੁੰਚ ਨੂੰ ਸੀਮਤ ਕਰਕੇ, ਸਰਕਾਰ ਅਣਜਾਣੇ ਵਿੱਚ ਡਿਜੀਟਲ ਰੱਖਿਅਕਾਂ ਨੂੰ ਨਿਰਸ਼ਸਤ ਕਰ ਰਹੀ ਹੈ ਜਦੋਂ ਕਿ ਵਿਰੋਧੀ ਲਗਾਤਾਰ ਅੱਗੇ ਵਧ ਰਹੇ ਹਨ।

ਟਕਰਾਅ: ਰਾਸ਼ਟਰੀ ਸੁਰੱਖਿਆ ਬਨਾਮ ਰੱਖਿਆ ਸਮਰੱਥਾ

ਤਣਾਅ ਉਦੋਂ ਸ਼ੁਰੂ ਹੋਇਆ ਜਦੋਂ ਅਮਰੀਕੀ ਸਰਕਾਰ ਨੇ ਅਣਐਲਾਨਿਤ ਰਾਸ਼ਟਰੀ ਸੁਰੱਖਿਆ ਚਿੰਤਾਵਾਂ ਦਾ ਹਵਾਲਾ ਦਿੰਦੇ ਹੋਏ Anthropic ਦੇ Fable ਅਤੇ Mythos ਮਾਡਲਾਂ 'ਤੇ ਐਕਸਪੋਰਟ ਕੰਟਰੋਲ ਆਰਡਰ ਜਾਰੀ ਕੀਤਾ। ਇਸ ਆਰਡਰ ਦੀ ਪਾਲਣਾ ਕਰਦੇ ਹੋਏ, Anthropic ਨੇ ਇਹਨਾਂ ਮਾਡਲਾਂ ਤੱਕ ਵਿਸ਼ਵਵਿਆਪੀ ਪਹੁੰਚ ਨੂੰ ਮੁਅੱਤਲ ਕਰ ਦਿੱਤਾ ਹੈ।

Mythos ਮਾਡਲ ਨੂੰ ਅਸਲ ਵਿੱਚ ਕਮਜ਼ੋਰੀਆਂ ਦੀ ਖੋਜ ਕਰਨ ਲਈ ਇੰਨੀ ਉੱਚ-ਪੱਧਰੀ ਸਮਰੱਥਾ ਨਾਲ ਤਿਆਰ ਕੀਤਾ ਗਿਆ ਸੀ ਕਿ Anthropic ਨੇ ਸ਼ੁਰੂ ਵਿੱਚ 15 ਦੇਸ਼ਾਂ ਦੀਆਂ ਲਗਭਗ 150 ਸੰਸਥਾਵਾਂ ਦੇ ਇੱਕ ਚੁਣੇ ਹੋਏ ਸਮੂਹ ਤੱਕ ਹੀ ਇਸਦੀ ਪਹੁੰਚ ਸੀਮਤ ਰੱਖੀ ਸੀ। ਜਨਤਕ ਵਰਜ਼ਨ, Fable, ਵਿੱਚ ਜੀਵ ਵਿਗਿਆਨ, ਰਸਾਇਣ ਵਿਗਿਆਨ ਅਤੇ ਸਾਈਬਰ ਸੁਰੱਖਿਆ ਵਿੱਚ ਦੁਰਵਰਤੋਂ ਨੂੰ ਰੋਕਣ ਲਈ ਸਖ਼ਤ ਗਾਰਡਰੇਲ (guardrails) ਸ਼ਾਮਲ ਕਰਨ ਦਾ ਉਦੇਸ਼ ਸੀ। ਹਾਲਾਂਕਿ, ਸਰਕਾਰ ਦੇ ਦਖਲ ਨੇ ਇੰਟਰਨੈੱਟ ਨੂੰ ਸੁਰੱਖਿਅਤ ਰੱਖਣ ਦੀ ਜ਼ਿੰਮੇਵਾਰੀ ਵਾਲੇ ਲੋਕਾਂ ਲਈ ਇਹਨਾਂ ਸ਼ਕਤੀਸ਼ਾਲੀ ਸਾਧਨਾਂ ਦੀ ਵਰਤੋਂ ਨੂੰ ਪ੍ਰਭਾਵਸ਼ਾਲੀ ਰੂਪ ਵਿੱਚ ਰੋਕ ਦਿੱਤਾ ਹੈ।

"Jailbreak" ਵਿਵਾਦ ਅਤੇ Amazon ਪੇਪਰ

Anthropic ਦਾ ਸੁਝਾਅ ਹੈ ਕਿ ਵ੍ਹਾਈਟ ਹਾਊਸ ਦਾ ਆਰਡਰ "jailbreaking"—ਸੁਰੱਖਿਆ ਗਾਰਡਰੇਲ ਨੂੰ ਬਾਈਪਾਸ ਕਰਨ ਲਈ ਵਰਤੀਆਂ ਜਾਣ ਵਾਲੀਆਂ ਵਿਧੀਆਂ—ਬਾਰੇ ਚਿੰਤਾਵਾਂ ਤੋਂ ਪੈਦਾ ਹੋ ਸਕਦਾ ਹੈ। ਰਿਪੋਰਟਾਂ ਅਨੁਸਾਰ ਇਹ ਚਿੰਤਾ Amazon ਦੇ ਖੋਜਕਰਤਾਵਾਂ ਦੇ ਇੱਕ ਗੈਰ-ਜਨਤਕ ਖੋਜ ਪੇਪਰ ਤੋਂ ਉੱਠੀ ਹੈ।

ਪੇਪਰ ਵਿੱਚ ਸੁਝਾਇਆ ਗਿਆ ਸੀ ਕਿ ਉਪਭੋਗਤਾ Mythos-ਪੱਧਰੀ ਸਮਰੱਥਾਵਾਂ ਤੱਕ ਪਹੁੰਚ ਕਰਨ ਲਈ Fable ਦੀਆਂ ਸੁਰੱਖਿਆ ਪਾਬੰਦੀਆਂ ਨੂੰ ਬਾਈਪਾਸ ਕਰ ਸਕਦੇ ਹਨ। ਹਾਲਾਂਕਿ, Katie Moussouris (Luta Security ਦੀ ਸੰਸਥਾਪਕ) ਸਮੇਤ ਸਾਈਬਰ ਸੁਰੱਖਿਆ ਮਾਹਰਾਂ ਦਾ ਤਰਕ ਹੈ ਕਿ ਇਹ AI ਦੀ ਉਪਯੋਗਤਾ ਦੀ ਇੱਕ ਬੁਨਿਆਦੀ ਗਲਤਫਹਿਮੀ ਹੈ। Moussouris ਦਾ ਕਹਿਣਾ ਹੈ ਕਿ ਦੱਸਿਆ ਗਿਆ "jailbreak" ਸਿਰਫ਼ ਮਾਡਲ ਦੁਆਰਾ ਆਪਣੇ ਨਿਰਧਾਰਤ ਕਾਰਜ ਨੂੰ ਪੂਰਾ ਕਰਨਾ ਸੀ: ਜਾਣੀਆਂ-ਪਛਾਣੀਆਂ ਕਮਜ਼ੋਰੀਆਂ ਵਾਲੇ ਓਪਨ-ਸੋਰਸ ਕੋਡ ਨੂੰ ਠੀਕ ਕਰਨਾ।

Moussouris ਦੇ ਅਨੁਸਾਰ, ਇੱਕ AI ਨੂੰ ਬੱਗ (bug) ਨੂੰ ਠੀਕ ਕਰਨ, ਪੈਚ (patch) ਦੀ ਵਿਆਖਿਆ ਕਰਨ ਅਤੇ ਟੈਸਟ ਲਿਖਣ ਲਈ ਕਹਿਣਾ ਕੋਈ ਸੁਰੱਖਿਆ ਉਲੰਘਣਾ ਨਹੀਂ ਹੈ; ਇਹ "find, fix, and test loop" ਹੈ ਜੋ ਆਧੁਨਿਕ ਰੱਖਿਆਤਮਕ ਸੁਰੱਖਿਆ ਨੂੰ ਪਰਿਭਾਸ਼ਿਤ ਕਰਦਾ ਹੈ। ਇਹਨਾਂ ਵਿਵਹਾਰਾਂ ਨੂੰ ਰੋਕਣ ਦੀ ਕੋਸ਼ਿਸ਼ ਮਾਡਲ ਦੀ ਸੌਫਟਵੇਅਰ ਦੀ ਰੱਖਿਆ ਕਰਨ ਦੀ ਸਮਰੱਥਾ ਨੂੰ ਬੁਨਿਆਦੀ ਰੂਪ ਵਿੱਚ ਅਪਾਹਜ ਕਰ ਦੇਵੇਗੀ।

ਉੱਚ-ਦਰਜੇ ਦੇ ਹਸਤਾਖਰਕਰਤਾ ਅਤੇ ਉਦਯੋਗਿਕ ਪ੍ਰਭਾਵ

ਇਹ ਖੁੱਲ੍ਹਾ ਪੱਤਰ ਸੁਰੱਖਿਆ ਭਾਈਚਾਰੇ ਦੇ ਪ੍ਰਮੁੱਖ ਹਸਤੀਆਂ ਦੁਆਰਾ ਸਮਰਥਿਤ ਹੈ, ਜਿਸ ਵਿੱਚ ਫੇਸਬੁੱਕ ਦੇ ਸਾਬਕਾ ਸੁਰੱਖਿਆ ਮੁਖੀ Alex Stamos, Bugcrowd ਦੇ ਸੰਸਥਾਪਕ Casey Ellis, ਅਤੇ ਮਸ਼ਹੂਰ ਕ੍ਰਿਪਟੋਗ੍ਰਾਫਰ Jon Callas ਸ਼ਾਮਲ ਹਨ। ਉਨ੍ਹਾਂ ਦਾ ਤਰਕ ਇੱਕ ਗੰਭੀਰ ਅਸੰਤੁਲਨ 'ਤੇ ਕੇਂਦਰਿਤ ਹੈ: ਜੇਕਰ ਰੱਖਿਆਕਾਰਾਂ ਨੂੰ ਅਤਿ-ਆਧੁਨਿਕ LLMs ਤੱਕ ਪਹੁੰਚ ਤੋਂ ਵਾਂਝਾ ਰੱਖਿਆ ਜਾਂਦਾ ਹੈ ਜਦੋਂ ਕਿ ਵਿਰੋਧੀਆਂ ਦੁਆਰਾ ਅਣਪਾਬੰਦੀਸ਼ੁਦਾ ਮਾਡਲਾਂ ਦੀ ਵਰਤੋਂ ਕੀਤੀ ਜਾਂਦੀ ਹੈ, ਤਾਂ ਵਿਸ਼ਵਵਿਆਪੀ ਸੁਰੱਖਿਆ ਸਥਿਤੀ ਕਮਜ਼ੋਰ ਹੋ ਜਾਂਦੀ