Did China Access Anthropic’s Mythos? Inside the National Security Debate

Translated for your language. Read the original.

AI-assisted draft.

In this article

ਕੀ ਚੀਨ ਨੇ Anthropic ਦੇ Mythos ਤੱਕ ਪਹੁੰਚ ਪ੍ਰਾਪਤ ਕੀਤੀ? ਰਾਸ਼ਟਰੀ ਸੁਰੱਖਿਆ ਬਹਿਸ ਦੇ ਅੰਦਰ

ਉੱਨਤ ਆਰਟੀਫੀਸ਼ੀਅਲ ਇੰਟੈਲੀਜੈਂਸ (AI) ਅਤੇ ਵਿਸ਼ਵਵਿਆਪੀ ਭੂ-ਰਾਜਨੀਤੀ ਦਾ ਸੁਮੇਲ ਉਸ ਸਮੇਂ ਇੱਕ ਗੰਭੀਰ ਮੋੜ 'ਤੇ ਪਹੁੰਚ ਗਿਆ ਹੈ ਜਦੋਂ ਇਹ ਰਿਪੋਰਟਾਂ ਸਾਹਮਣੇ ਆਈਆਂ ਹਨ ਕਿ ਚੀਨ ਨੇ Anthropic ਦੇ ਬਹੁਤ ਹੀ ਸੰਵੇਦਨਸ਼ੀਲ ਮਾਡਲਾਂ ਤੱਕ ਪਹੁੰਚ ਪ੍ਰਾਪਤ ਕਰ ਲਈ ਹੋ ਸਕਦੀ ਹੈ। ਜਦੋਂ ਵ੍ਹਾਈਟ ਹਾਊਸ ਸਖ਼ਤ ਨਿਰਯਾਤ ਨਿਯੰਤਰਣਾਂ 'ਤੇ ਵਿਚਾਰ ਕਰ ਰਿਹਾ ਹੈ, Mythos ਵਰਗੀ ਪ੍ਰਮੁੱਖ ਤਕਨਾਲੋਜੀ ਦੇ ਸੰਭਾਵੀ ਲੀਕ ਹੋਣ ਨਾਲ ਮਾਡਲ ਦੀ ਸੁਰੱਖਿਆ ਅਤੇ AI ਸਰਵਉੱਚਤਾ ਦੀ ਦੌੜ ਬਾਰੇ ਡੂੰਘੇ ਸਵਾਲ ਖੜ੍ਹੇ ਹੋ ਗਏ ਹਨ।

ਮਾਡਲ ਦੇ ਪ੍ਰਗਟ ਹੋਣ ਨਾਲ ਰਾਸ਼ਟਰੀ ਸੁਰੱਖਿਆ ਦਾ ਖ਼ਤਰਾ

Semafor ਦੀ ਇੱਕ ਤਾਜ਼ਾ ਰਿਪੋਰਟ ਅਨੁਸਾਰ, Anthropic ਦੇ Mythos 'ਤੇ ਨਿਰਯਾਤ ਪਾਬੰਦੀਆਂ ਲਗਾਉਣ ਦਾ ਵ੍ਹਾਈਟ ਹਾਊਸ ਦਾ ਫੈਸਲਾ ਅੰਸ਼ਕ ਤੌਰ 'ਤੇ ਉਸ ਖੁਫੀਆ ਜਾਣਕਾਰੀ ਤੋਂ ਪ੍ਰੇਰਿਤ ਸੀ ਜੋ ਸੰਕੇਤ ਦਿੰਦੀ ਹੈ ਕਿ ਮਾਡਲ ਤੱਕ ਚੀਨ ਨਾਲ ਜੁੜੇ ਇੱਕ ਸਮੂਹ ਦੁਆਰਾ ਪਹੁੰਚ ਪ੍ਰਾਪਤ ਕੀਤੀ ਗਈ ਹੋ ਸਕਦੀ ਹੈ। ਜੇਕਰ ਚੀਨੀ ਸਰਕਾਰ ਨੇ ਸੱਚਮੁੱਚ Mythos 5 ਜਾਂ Fable 5 ਵਰਗੇ ਉੱਚ-ਦਰਜੇ ਦੇ ਮਾਡਲਾਂ ਤੱਕ ਪਹੁੰਚ ਪ੍ਰਾਪਤ ਕਰ ਲਈ ਹੈ, ਤਾਂ ਵਿਸ਼ਵਵਿਆਪੀ ਸੁਰੱਖਿਆ ਲਈ ਇਸਦੇ ਪ੍ਰਭਾਵ ਬਹੁਤ ਵੱਡੇ ਹਨ।

ਖੁਫੀਆ ਏਜੰਸੀਆਂ ਲਈ ਮੁੱਖ ਚਿੰਤਾ ਸਿਰਫ਼ ਇਹਨਾਂ ਮਾਡਲਾਂ ਦੀ ਸਿੱਧੀ ਵਰਤੋਂ ਨਹੀਂ ਹੈ, ਸਗੋਂ ਰਿਵਰਸ ਇੰਜੀਨੀਅਰਿੰਗ (reverse engineering) ਦਾ ਖ਼ਤਰਾ ਹੈ। 'ਡਿਸਟੀਲੇਸ਼ਨ' (distillation) ਵਜੋਂ ਜਾਣੀ ਜਾਂਦੀ ਪ੍ਰਕਿਰਿਆ ਰਾਹੀਂ, ਇੱਕ ਵਿਰੋਧੀ ਇੱਕ "teacher" ਮਾਡਲ—ਇਸ ਮਾਮਲੇ ਵਿੱਚ, ਉੱਨਤ Mythos—ਦੀ ਵਰਤੋਂ ਇੱਕ ਛੋਟੇ "student" AI ਨੂੰ ਸਿਖਲਾਈ ਦੇਣ ਲਈ ਕਰ ਸਕਦਾ ਹੈ। ਇਹ ਇੱਕ ਮੁਕਾਬਲੇਬਾਜ਼ ਸ਼ਕਤੀ ਨੂੰ ਅਸਲ ਵਿਕਾਸ ਲਾਗਤ ਦੇ ਇੱਕ ਛੋਟੇ ਹਿੱਸੇ 'ਤੇ ਇੱਕ ਮਲਕੀਅਤ ਵਾਲੇ ਮਾਡਲ ਦੀਆਂ ਗੁੰਝਲਦਾਰ ਤਰਕਸ਼ੀਲਤਾ ਅਤੇ ਵਿਵਹਾਰਕ ਪੈਟਰਨਾਂ ਦੀ ਨਕਲ ਕਰਨ ਦੀ ਇਜਾਜ਼ਤ ਦਿੰਦਾ ਹੈ, ਜੋ ਅਸਰਦਾਰ ਰੂਪ ਵਿੱਚ US-ਅਧਾਰਤ ਲੈਬਾਂ ਕੋਲ ਮੌਜੂਦ ਤਕਨੀਕੀ ਲਾਭ ਨੂੰ ਖਤਮ ਕਰ ਸਕਦਾ ਹੈ।

ਸੁਰੱਖਿਆ ਉਲੰਘਣਾਵਾਂ ਅਤੇ ਜੇਲਬ੍ਰੇਕਿੰਗ (Jailbreaking) ਬਹਿਸ

ਹਾਲਾਂਕਿ ਵ੍ਹਾਈਟ ਹਾਊਸ ਦੁਆਰਾ ਚੀਨ ਦੇ ਸੰਬੰਧ ਦੀ ਪੁਸ਼ਟੀ ਨਹੀਂ ਕੀਤੀ ਗਈ ਹੈ, Mythos ਦੀ ਕਮਜ਼ੋਰੀ ਬਾਰੇ ਚਰਚਾ ਬਹੁ-ਪੱਖੀ ਹੈ। ਸਲਾਹਕਾਰ ਡੇਵਿਡ ਸੈਕਸ ਸਮੇਤ ਕੁਝ ਤਕਨੀਕੀ ਟਿੱਪਣੀਕਾਰਾਂ ਨੇ Fable ਅਤੇ Mythos ਦੇ "jailbreaking" ਪ੍ਰਤੀ ਸੰਵੇਦਨਸ਼ੀਲ ਹੋਣ ਬਾਰੇ ਚਿੰਤਾਵਾਂ ਪ੍ਰਗਟਾਈਆਂ ਹਨ—ਜੋ ਕਿ ਸੁਰੱਖਿਆ ਗਾਰਡਰੇਲ ਨੂੰ ਬਾਈਪਾਸ ਕਰਨ ਦੀ ਪ੍ਰਕਿਰਿਆ ਹੈ ਤਾਂ ਜੋ AI ਨੂੰ ਮਨ੍ਹਾ ਕੀਤੇ ਗਏ ਵਿਵਹਾਰਾਂ ਲਈ ਮਜਬੂਰ ਕੀਤਾ ਜਾ ਸਕੇ। ਹਾਲਾਂਕਿ Anthropic ਨੇ ਇਨ੍ਹਾਂ ਦਾਅਵਿਆਂ ਨੂੰ ਨਕਾਰ ਦਿੱਤਾ ਹੈ, ਪਰ ਵਿਵਾਦ ਜਾਰੀ ਹੈ।

ਇਹ ਪਹਿਲੀ ਵਾਰ ਨਹੀਂ ਹੈ ਜਦੋਂ Anthropic ਦੀਆਂ ਸਭ ਤੋਂ ਸ਼ਕਤੀਸ਼ਾਲੀ ਸੰਪਤੀਆਂ ਨੂੰ ਜਾਂਚ ਦਾ ਸਾਹਮਣਾ ਕਰਨਾ ਪਿਆ ਹੈ। ਕੰਪਨੀ ਦੇ ਇਸ ਪੱਖ ਦੇ ਬਾਵਜੂਦ ਕਿ Mythos ਆਮ ਜਨਤਾ ਦੀ ਵਰਤੋਂ ਲਈ ਬਹੁਤ ਖ਼ਤਰਨਾਕ ਅਤੇ ਸ਼ਕਤੀਸ਼ਾਲੀ ਹੈ, ਇੱਕ ਰਿਪੋਰਟ ਕੀਤੀ ਗਈ ਸੁਰੱਖਿਆ ਉਲੰਘਣਾ ਨੇ ਇੱਕ Discord ਸਮੂਹ ਨੂੰ Anthropic ਦੇ ਦਖਲ ਦੇਣ ਤੋਂ ਪਹਿਲਾਂ ਦੋ ਹਫ਼ਤਿਆਂ ਲਈ ਮਾਡਲ ਤੱਕ ਪਹੁੰਚ ਪ੍ਰਾਪਤ ਕਰਨ ਦਿੱਤੀ। ਅਣਅਧਿਕਾਰਤ ਪਹੁੰਚ ਦਾ ਇਹ ਪੈਟਰਨ ਫਰੰਟੀਅਰ ਮਾਡਲਾਂ ਦੇ ਆਲੇ-ਦੁਆਲੇ "walled gardens" ਬਣਾਈ ਰੱਖਣ ਦੀ ਮੁਸ਼ਕਲ ਨੂੰ ਉਜਾਗਰ ਕਰਦਾ ਹੈ।

ਇਹ AI ਲੈਂਡਸਕੇਪ ਲਈ ਕਿਉਂ ਮਹੱਤਵਪੂਰਨ ਹੈ

Mythos ਦੀ ਸੰਭਾਵੀ ਚੋਰੀ AI ਉਦਯੋਗ ਲਈ ਇੱਕ ਮਹੱਤਵਪੂਰਨ ਮੋੜ ਹੈ। ਇਹ ਫਰੰਟੀਅਰ ਮਾਡਲਾਂ ਦੀ ਤੇਜ਼ੀ ਨਾਲ ਹੋ ਰਹੀ ਤਰੱਕੀ ਅਤੇ ਰਾਜ-ਸਪਾਂਸਰਡ ਹਕਰਾਂ ਵਿਰੁੱਧ ਉਹਨਾਂ ਨੂੰ ਸੁਰੱਖਿਅਤ ਰੱਖਣ ਲਈ ਕਾਰਪੋਰੇਸ਼ਨਾਂ ਦੀ ਸਮਰੱਥਾ ਵਿਚਕਾਰ ਵਧਦੇ ਤਣਾਅ ਨੂੰ ਉਜਾਗਰ ਕਰਦਾ ਹੈ। ਜਿਵੇਂ-ਜਿਵੇਂ ਮਾਡਲ ਗੁੰਝਲਦਾਰ ਤਰਕ (reasoning) ਅਤੇ ਕੋਡ ਜਨਰੇਸ਼ਨ ਵਿੱਚ ਵਧੇਰੇ ਸਮਰੱਥ ਹੋ ਰਹੇ ਹਨ, ਉਹ ਸਿਰਫ਼ ਸੌਫਟਵੇਅਰ ਟੂਲਸ ਤੋਂ ਬਦਲ ਕੇ ਰਣਨੀਤਕ ਰਾਸ਼ਟਰੀ ਸੰਪਤੀਆਂ ਬਣਦੇ ਜਾ ਰਹੇ ਹਨ।

ਡਿਵੈਲਪਰਾਂ ਅਤੇ ਸੰਸਥਾਪਕਾਂ ਲਈ, ਇਹ ਵਿਕਾਸ ਨਿਯਮਤ ਮਾਹੌਲ ਵਿੱਚ ਇੱਕ ਤਬਦੀਲੀ ਦਾ ਸੰਕੇਤ ਦਿੰਦਾ ਹੈ। ਅਸੀਂ ਇੱਕ ਅਜਿਹੇ ਯੁੱਗ ਵਿੱਚ ਪ੍ਰਵੇਸ਼ ਕਰ ਰਹੇ ਹਾਂ ਜਿੱਥੇ AI ਸੁਰੱਖਿਆ ਹੁਣ ਸਿਰਫ਼ ਪੱਖਪਾਤੀ ਆਉਟਪੁੱਟ ਜਾਂ ਜ਼ਹਿਰੀਲੇ ਟੈਕਸਟ ਨੂੰ ਰੋਕਣ ਬਾਰੇ ਨਹੀਂ ਹੈ, ਸਗੋਂ ਅੰਤਰਰਾਸ਼ਟਰੀ ਜਾਸੂਸੀ ਅਤੇ ਅਣਅਧਿਕਾਰਤ ਡਿਸਟੀਲੇਸ਼ਨ ਤੋਂ ਮਾਡਲਾਂ ਦੇ ਅੰਡਰਲਾਈਂ ਵੇਟਸ (weights) ਅਤੇ ਲੌਜਿਕ ਦੀ ਰੱਖਿਆ ਕਰਨ ਬਾਰੇ ਹੈ।

ਮੁੱਖ ਨੁਕਤੇ

ਡਿਸਟੀਲੇਸ਼ਨ ਦੇ ਜੋਖਮ: Mythos ਵਰਗੇ ਫਰੰਟੀਅਰ ਮਾਡਲਾਂ ਤੱਕ ਅਣਅਧਿਕਾਰਤ ਪਹੁੰਚ ਵਿਰੋਧੀਆਂ ਨੂੰ "ਸਟੂਡੈਂਟ" ਮਾਡਲਾਂ ਰਾਹੀਂ ਉੱਚ-ਪੱਧਰੀ AI ਸਮਰੱਥਾਵਾਂ ਦੀ ਨਕਲ ਕਰਨ ਲਈ ਡਿਸਟੀਲੇਸ਼ਨ ਦੀ ਵਰਤੋਂ ਕਰਨ ਦੇ ਯੋਗ ਬਣਾਉਂਦੀ ਹੈ।
ਸੁਰੱਖਿਆ ਕਮਜ਼ੋਰੀਆਂ: Anthropic ਨੂੰ ਪਹਿਲਾਂ ਵੀ ਸੁਰੱਖਿਆ ਕਮੀਆਂ ਦਾ ਸਾਹਮਣਾ ਕਰਨਾ ਪਿਆ ਹੈ, ਜਿਸ ਵਿੱਚ ਇੱਕ Discord ਗਰੁੱਪ ਦੁਆਰਾ ਦੋ ਹਫ਼ਤਿਆਂ ਦੀ ਉਲੰਘਣਾ ਸ਼ਾਮਲ ਹੈ, ਜੋ ਕਿ ਮਲਕੀਅਤ ਵਾਲੇ ਫਰੰਟੀਅਰ AI ਨੂੰ ਸੁਰੱਖਿਅਤ ਰੱਖਣ ਦੀਆਂ ਚੁਣੌਤੀਆਂ ਨੂੰ ਉਜਾਗਰ ਕਰਦਾ ਹੈ।
ਭੂ-ਰਾਜਨੀਤਿਕ ਨਿਯਮ: White House ਅਧੁਨਿਕ AI ਮਾਡਲਾਂ ਨੂੰ ਵੱਧ ਤੋਂ ਵੱਧ ਰਾਸ਼ਟਰੀ ਸੁਰੱਖਿਆ ਦੇ ਨਜ਼ਰੀਏ ਤੋਂ ਦੇਖ ਰਿਹਾ ਹੈ, ਅਤੇ ਚੀਨ ਨੂੰ ਤਕਨੀਕੀ ਤਬਦੀਲੀ ਦੇ ਜੋਖਮ ਨੂੰ ਘਟਾਉਣ ਲਈ ਐਕਸਪੋਰਟ ਕੰਟਰੋਲ ਦੀ ਵਰਤੋਂ ਕਰ ਰਿਹਾ ਹੈ।