ਪ੍ਰੀ-ਲੌਂਚ AI ਸਿਮੂਲੇਸ਼ਨ ਨਵੇਂ ਮਾਡਲ ਸੁਰੱਖਿਆ ਚੈੱਕ ਹਨ

📅4 hours ago⏱2 min read

𝗣𝗿𝗲-𝗟𝗮𝘂𝗻𝗰𝗵 𝗔𝗜 𝗦𝗶𝗺𝘂𝗹𝗮𝘁𝗶𝗼𝗻𝘀 ਮਾਡਲ ਸੁਰੱਖਿਆ ਦੀ ਨਵੀਂ ਜਾਂਚ ਹਨ।

AI ਸੁਰੱਖਿਆ ਬਦਲ ਰਹੀ ਹੈ। ਇਹ ਚੇਤਾਵਨੀ ਲੇਬਲਾਂ ਤੋਂ ਹੁਣ ਅਭਿਆਸਾਂ (rehearsals) ਵੱਲ ਵਧ ਰਹੀ ਹੈ।

OpenAI ਨੇ ਹਾਲ ਹੀ ਵਿੱਚ ਰਿਲੀਜ਼ ਤੋਂ ਪਹਿਲਾਂ ਮਾਡਲ ਦੇ ਵਿਵਹਾਰ ਦੀ ਭਵਿੱਖਬਾਣੀ ਕਰਨ ਬਾਰੇ ਕੰਮ ਸਾਂਝਾ ਕੀਤਾ ਹੈ। ਉਹ ਇਹ ਦੇਖਣ ਲਈ ਸਿਮੂਲੇਸ਼ਨਾਂ (simulations) ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹਨ ਕਿ ਕਿਵੇਂ ਲੋਕ ਅਤੇ ਹਮਲਾਵਰ ਅਸਲ ਜ਼ਿੰਦਗੀ ਵਿੱਚ ਮਾਡਲਾਂ ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹਨ।

ਇਹ ਸਾਰੇ ਬਿਲਡਰਾਂ (builders) ਲਈ ਇੱਕ ਸੰਕੇਤ ਹੈ। ਤੁਹਾਨੂੰ ਮਾਡਲਾਂ ਨੂੰ ਲਾਂਚ ਕਰਕੇ ਉਨ੍ਹਾਂ ਦੇ ਨਤੀਜਿਆਂ (fallout) ਦੀ ਨਿਗਰਾਨੀ ਕਰਨਾ ਬੰਦ ਕਰ ਦੇਣਾ ਚਾਹੀਦਾ ਹੈ। ਤੁਹਾਨੂੰ ਲਾਂਚ ਕਰਨ ਤੋਂ ਪਹਿਲਾਂ ਹੀ ਉਨ੍ਹਾਂ ਨਤੀਜਿਆਂ ਦਾ ਸਿਮੂਲੇਸ਼ਨ ਸ਼ੁਰੂ ਕਰ ਦੇਣਾ ਚਾਹੀਦਾ ਹੈ।

ਮਿਆਰੀ ਮੁਲਾਂਕਣ (Standard evaluations) ਬੈਂਚਮਾਰਕਸ ਅਤੇ ਰੈੱਡ-ਟੀਮਿੰਗ (red-teaming) 'ਤੇ ਕੇਂਦਰਿਤ ਹੁੰਦੇ ਹਨ। ਇਹ ਇੱਕ ਮਹੱਤਵਪੂਰਨ ਨੁਕਤੇ ਨੂੰ ਛੱਡ ਦਿੰਦੇ ਹਨ। ਮਾਡਲ ਅਸਲ ਵਰਕਫਲੋਅ (workflows) ਦੇ ਅੰਦਰ ਵੱਖਰੇ ਤਰੀਕੇ ਨਾਲ ਕੰਮ ਕਰਦੇ ਹਨ।

ਹੈਲਥਕੇਅਰ ਵਿੱਚ ਇੱਕ ਚੈਟਬੋਟ, ਰੈਪੋ (repo) ਐਕਸੈਸ ਵਾਲੇ ਕੋਡਿੰਗ ਏਜੰਟ ਨਾਲੋਂ ਵੱਖਰੇ ਤਰੀਕੇ ਨਾਲ ਕੰਮ ਕਰਦਾ ਹੈ। ਮਾਡਲ ਉਹੀ ਰਹਿੰਦਾ ਹੈ, ਪਰ ਇਜਾਜ਼ਤਾਂ (permissions) ਅਤੇ ਉਪਭੋਗਤਾ ਦੀਆਂ ਉਮੀਦਾਂ ਬਦਲ ਜਾਂਦੀਆਂ ਹਨ।

ਡਿਪਲਾਈਮੈਂਟ ਸਿਮੂਲੇਸ਼ਨ ਪੂਰੀ ਸਥਿਤੀ ਦੀ ਜਾਂਚ ਕਰਦਾ ਹੈ। ਤੁਸੀਂ ਪੁੱਛਦੇ ਹੋ: "ਜਦੋਂ ਇਹ ਉਪਭੋਗਤਾ ਇਸ ਦਬਾਅ ਹੇਠ ਇਸ ਟੂਲ ਦੀ ਵਰਤੋਂ ਕਰਦਾ ਹੈ ਤਾਂ ਕੀ ਹੁੰਦਾ ਹੈ?"

ਇਹ ਕਰਨ ਲਈ ਤੁਹਾਨੂੰ ਕਿਸੇ ਵੱਡੀ ਲੈਬ ਦੀ ਲੋੜ ਨਹੀਂ ਹੈ। ਤੁਸੀਂ ਛੋਟੇ ਪੱਧਰ ਤੋਂ ਸ਼ੁਰੂ ਕਰ ਸਕਦੇ ਹੋ।

ਆਪਣੇ AI ਉਤਪਾਦਾਂ ਲਈ ਇਹਨਾਂ ਕਦਮਾਂ ਦੀ ਵਰਤੋਂ ਕਰੋ:

ਸਿਰਫ਼ ਸਿੰਗਲ ਪ੍ਰੋਂਪਟ (prompts) ਹੀ ਨਹੀਂ, ਸਗੋਂ ਅਸਲ ਉਪਭੋਗਤਾ ਦੇ ਕੰਮਾਂ ਦੇ ਆਲੇ-ਦੁਆਲੇ ਟੈਸਟ ਲਿਖੋ।
ਆਪਣੇ ਟੈਸਟਾਂ ਵਿੱਚ ਫਾਈਲ ਲਿਖਣ, ਈਮੇਲ, ਜਾਂ ਭੁਗਤਾਨ ਵਰਗੇ ਟੂਲ ਐਕਸੈਸ ਨੂੰ ਸ਼ਾਮਲ ਕਰੋ।
ਟੈਸਟ ਕਰੋ ਕਿ AI ਗਲਤੀਆਂ ਜਾਂ ਗੁੰਮ ਹੋਏ ਸੰਦਰਭ (context) ਤੋਂ ਕਿਵੇਂ ਉਭਰਦਾ ਹੈ।
ਅਜਿਹੇ ਐਡਵਰਸੇਰੀਅਲ ਉਦਾਹਰਣਾਂ (adversarial examples) ਦੀ ਵਰਤੋਂ ਕਰੋ ਜੋ ਤੁਹਾਡੇ ਵਿਸ਼ੇਸ਼ ਉਤਪਾਦ ਨਾਲ ਮੇਲ ਖਾਂਦੀਆਂ ਹੋਣ।
'ਨੀਅਰ ਮਿਸਿਜ਼' (near misses) ਨੂੰ ਲੌਗ ਕਰੋ ਅਤੇ ਉਹਨਾਂ ਨੂੰ ਨਵੇਂ ਟੈਸਟਾਂ ਵਿੱਚ ਬਦਲੋ।

ਇਹ AI ਏਜੰਟਾਂ ਲਈ ਬਹੁਤ ਮਹੱਤਵਪੂਰਨ ਹੈ। ਇੱਕ ਚੈਟਬੋਟ ਟੈਕਸਟ ਵਿੱਚ ਗਲਤੀਆਂ ਕਰਦਾ ਹੈ। ਇੱਕ ਏਜੰਟ ਕਾਰਵਾਈ (action) ਕਰਦੇ ਸਮੇਂ ਗਲਤੀਆਂ ਕਰਦਾ ਹੈ। ਇਹ ਤੁਹਾਡੇ ਜੋਖਮ ਦੇ ਪੱਧਰ ਨੂੰ ਬਦਲ ਦਿੰਦਾ ਹੈ।

ਇੱਕ ਭਰੋਸੇਯੋਗ ਸਿਸਟਮ ਬਣਾਉਣ ਲਈ, ਇਸ ਫਰੇਮਵਰਕ ਦੀ ਪਾਲਣਾ ਕਰੋ:

ਖ਼ਤਰਨਾਕ ਕਿਰਿਆਵਾਂ (verbs) ਦੀ ਸੂਚੀ ਬਣਾਓ: ਡਿਲੀਟ ਕਰਨਾ, ਭੇਜਣਾ, ਪ੍ਰਕਾਸ਼ਿਤ ਕਰਨਾ, ਚਾਰਜ ਕਰਨਾ, ਜਾਂ ਮਨਜ਼ੂਰੀ ਦੇਣਾ।
ਭੂਮਿਕਾ-ਅਧਾਰਤ (role-based) ਸਥਿਤੀਆਂ ਬਣਾਓ: ਇੱਕ ਸ਼ੁਰੂਆਤ ਕਰਨ ਵਾਲੇ, ਇੱਕ ਪਾਵਰ ਯੂਜ਼ਰ, ਅਤੇ ਇੱਕ ਮਾੜੇ ਇਰਾਦੇ ਵਾਲੇ (malicious) ਉਪਭੋਗਤਾ ਦਾ ਟੈਸਟ ਕਰੋ।
ਗੁੰਝਲਦਾਰ ਸੰਦਰਭ (messy context) ਦੀ ਵਰਤੋਂ ਕਰੋ: AI ਨੂੰ ਪੁਰਾਣਾ ਡੇਟਾ ਜਾਂ ਵਿਰੋਧੀ ਨਿਰਦੇਸ਼ ਦਿਓ।
ਹਾਰਡ ਸਟੌਪਸ (hard stops) ਜੋੜੋ: ਅਜਿਹੀਆਂ ਕਾਰਵਾਈਆਂ ਤੋਂ ਪਹਿਲਾਂ ਮਨੁੱਖੀ ਸਮੀਖਿਆ (human review) ਲਾਜ਼ਮੀ ਕਰੋ ਜਿਨ੍ਹਾਂ ਨੂੰ ਵਾਪਸ ਨਹੀਂ ਲਿਆ ਜਾ ਸਕਦਾ।
ਬੋਰਿੰਗ ਭਰੋਸੇਯੋਗਤਾ (boring reliability) ਨੂੰ ਟ੍ਰੈਕ ਕਰੋ: ਮਾਪੋ ਕਿ ਮਾਡਲ ਅਨਿਸ਼ਚਿਤਤਾ (uncertainty) ਨੂੰ ਕਿਵੇਂ ਸੰਭਾਲਦਾ ਹੈ।

ਮਕਸਦ AI ਨੂੰ ਡਰਪੋਕ ਬਣਾਉਣਾ ਨਹੀਂ ਹੈ। ਮਕਸਦ ਇਸਨੂੰ ਭਵਿੱਖਬਾਣੀਯੋਗ (predictable) ਬਣਾਉਣਾ ਹੈ।

ਕੋਈ ਵੀ ਸਿਮੂਲੇਸ਼ਨ ਸੰਪੂਰਨ ਨਹੀਂ ਹੁੰਦਾ। ਉਪਭੋਗਤਾ ਹਮੇਸ਼ਾ ਅਜਿਹੇ ਤਰੀਕੇ ਲੱਭ ਲੈਣਗੇ ਜਿਨ੍ਹਾਂ ਦੀ ਤੁਸੀਂ ਭਵਿੱਖਬਾਣੀ ਨਹੀਂ ਕੀਤੀ ਹੋਵੇਗੀ। ਤੁਹਾਨੂੰ ਲੇਅਰਾਂ (layers) ਦੀ ਲੋੜ ਹੈ: ਸਿਮੂਲੇਸ਼ਨ, ਸੀਮਤ ਰੋਲਆਊਟਸ (rollouts), ਨਿਗਰਾਨੀ, ਅਤੇ ਤੇਜ਼ ਰੋਲਬੈਕ (rollback) ਮਾਰਗ।

ਮਾਡਲ ਮੁਲਾਂਕਣ (Model evaluation) ਹੁਣ ਸਾਫਟਵੇਅਰ ਇੰਜੀਨੀਅਰਿੰਗ ਵਾਂਗ ਬਣ ਰਿਹਾ ਹੈ। ਇਹ ਸਥਿਤੀ-ਅਧਾਰਤ (scenario-driven) ਅਤੇ ਵਰਕਫਲੋ-ਜਾਗਰੂਕ (workflow-aware) ਹੋਣਾ ਚਾਹੀਦਾ ਹੈ।

ਤੁਹਾਨੂੰ ਕਿਸੇ ਰਿਸਰਚ ਲੈਬ ਦੀ ਲੋੜ ਨਹੀਂ ਹੈ। ਤੁਹਾਨੂੰ ਅਸਲ ਉਪਭੋਗਤਾ ਦੇ ਕੰਮਾਂ ਅਤੇ AI ਨੂੰ ਸਿਰਫ਼ ਇੱਕ ਟੈਕਸਟ ਜਨਰੇਟਰ ਵਜੋਂ ਨਹੀਂ, ਸਗੋਂ ਇੱਕ ਕਾਰਕ (actor) ਵਜੋਂ ਟੈਸਟ ਕਰਨ ਦੇ ਅਨੁਸ਼ਾਸਨ ਦੀ ਲੋੜ ਹੈ।

ਸਰੋਤ: https://dev.to/jenueldev/pre-launch-ai-simulations-are-becoming-the-new-model-safety-check-107e

ਵਿਕਲਪਿਕ ਲਰਨਿੰਗ ਕਮਿਊਨਿਟੀ: https://t.me/GyaanSetuAi

ਪ੍ਰੀ-ਲੌਂਚ AI ਸਿਮੂਲੇਸ਼ਨ ਨਵੇਂ ਮਾਡਲ ਸੁਰੱਖਿਆ ਚੈੱਕ ਹਨ

Continue reading

𝗔𝗜 𝗜𝘀 𝗠𝗼𝗿𝗲 𝗧𝗵𝗮𝗻 𝗣𝗿𝗼𝗺𝗽𝘁𝘀

AI ਜੋਖਮ ਪ੍ਰਬੰਧਨ ਦੀਆਂ ਗਲਤੀਆਂ

𝗛𝗼𝘄 𝘁𝗼 𝗜𝗺𝗽𝗹𝗲𝗺𝗲𝗻𝘁 𝗔𝗜 𝗥𝗶𝘀𝗸 𝗠𝗮𝗻𝗮𝗴𝗲𝗺𝗲𝗻𝘁

𝗔𝗜 𝗥𝗶𝘀𝗸 𝗠𝗮𝗻𝗮𝗴𝗲𝗺𝗲𝗻𝘁 𝗚𝘂𝗶𝗱𝗲

ਲੌਂਚ ਤੋਂ ਪਹਿਲਾਂ ਦੀਆਂ AI ਸਿਮੂਲੇਸ਼ਨਾਂ ਨਵਾਂ ਸੁਰੱਖਿਆ ਚੈੱਕ ਹਨ