𝗣𝗿𝗲-𝗟𝗮𝘂𝗻𝗰𝗵 𝗔𝗜 𝗦𝗶𝗺𝘂𝗹𝗮𝘁𝗶𝗼𝗻𝘀 ਮਾਡਲ ਸੁਰੱਖਿਆ ਦੀ ਨਵੀਂ ਜਾਂਚ ਹਨ।
AI ਸੁਰੱਖਿਆ ਬਦਲ ਰਹੀ ਹੈ। ਇਹ ਚੇਤਾਵਨੀ ਲੇਬਲਾਂ ਤੋਂ ਹੁਣ ਅਭਿਆਸਾਂ (rehearsals) ਵੱਲ ਵਧ ਰਹੀ ਹੈ।
OpenAI ਨੇ ਹਾਲ ਹੀ ਵਿੱਚ ਰਿਲੀਜ਼ ਤੋਂ ਪਹਿਲਾਂ ਮਾਡਲ ਦੇ ਵਿਵਹਾਰ ਦੀ ਭਵਿੱਖਬਾਣੀ ਕਰਨ ਬਾਰੇ ਕੰਮ ਸਾਂਝਾ ਕੀਤਾ ਹੈ। ਉਹ ਇਹ ਦੇਖਣ ਲਈ ਸਿਮੂਲੇਸ਼ਨਾਂ (simulations) ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹਨ ਕਿ ਕਿਵੇਂ ਲੋਕ ਅਤੇ ਹਮਲਾਵਰ ਅਸਲ ਜ਼ਿੰਦਗੀ ਵਿੱਚ ਮਾਡਲਾਂ ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹਨ।
ਇਹ ਸਾਰੇ ਬਿਲਡਰਾਂ (builders) ਲਈ ਇੱਕ ਸੰਕੇਤ ਹੈ। ਤੁਹਾਨੂੰ ਮਾਡਲਾਂ ਨੂੰ ਲਾਂਚ ਕਰਕੇ ਉਨ੍ਹਾਂ ਦੇ ਨਤੀਜਿਆਂ (fallout) ਦੀ ਨਿਗਰਾਨੀ ਕਰਨਾ ਬੰਦ ਕਰ ਦੇਣਾ ਚਾਹੀਦਾ ਹੈ। ਤੁਹਾਨੂੰ ਲਾਂਚ ਕਰਨ ਤੋਂ ਪਹਿਲਾਂ ਹੀ ਉਨ੍ਹਾਂ ਨਤੀਜਿਆਂ ਦਾ ਸਿਮੂਲੇਸ਼ਨ ਸ਼ੁਰੂ ਕਰ ਦੇਣਾ ਚਾਹੀਦਾ ਹੈ।
ਮਿਆਰੀ ਮੁਲਾਂਕਣ (Standard evaluations) ਬੈਂਚਮਾਰਕਸ ਅਤੇ ਰੈੱਡ-ਟੀਮਿੰਗ (red-teaming) 'ਤੇ ਕੇਂਦਰਿਤ ਹੁੰਦੇ ਹਨ। ਇਹ ਇੱਕ ਮਹੱਤਵਪੂਰਨ ਨੁਕਤੇ ਨੂੰ ਛੱਡ ਦਿੰਦੇ ਹਨ। ਮਾਡਲ ਅਸਲ ਵਰਕਫਲੋਅ (workflows) ਦੇ ਅੰਦਰ ਵੱਖਰੇ ਤਰੀਕੇ ਨਾਲ ਕੰਮ ਕਰਦੇ ਹਨ।
ਹੈਲਥਕੇਅਰ ਵਿੱਚ ਇੱਕ ਚੈਟਬੋਟ, ਰੈਪੋ (repo) ਐਕਸੈਸ ਵਾਲੇ ਕੋਡਿੰਗ ਏਜੰਟ ਨਾਲੋਂ ਵੱਖਰੇ ਤਰੀਕੇ ਨਾਲ ਕੰਮ ਕਰਦਾ ਹੈ। ਮਾਡਲ ਉਹੀ ਰਹਿੰਦਾ ਹੈ, ਪਰ ਇਜਾਜ਼ਤਾਂ (permissions) ਅਤੇ ਉਪਭੋਗਤਾ ਦੀਆਂ ਉਮੀਦਾਂ ਬਦਲ ਜਾਂਦੀਆਂ ਹਨ।
ਡਿਪਲਾਈਮੈਂਟ ਸਿਮੂਲੇਸ਼ਨ ਪੂਰੀ ਸਥਿਤੀ ਦੀ ਜਾਂਚ ਕਰਦਾ ਹੈ। ਤੁਸੀਂ ਪੁੱਛਦੇ ਹੋ: "ਜਦੋਂ ਇਹ ਉਪਭੋਗਤਾ ਇਸ ਦਬਾਅ ਹੇਠ ਇਸ ਟੂਲ ਦੀ ਵਰਤੋਂ ਕਰਦਾ ਹੈ ਤਾਂ ਕੀ ਹੁੰਦਾ ਹੈ?"
ਇਹ ਕਰਨ ਲਈ ਤੁਹਾਨੂੰ ਕਿਸੇ ਵੱਡੀ ਲੈਬ ਦੀ ਲੋੜ ਨਹੀਂ ਹੈ। ਤੁਸੀਂ ਛੋਟੇ ਪੱਧਰ ਤੋਂ ਸ਼ੁਰੂ ਕਰ ਸਕਦੇ ਹੋ।
ਆਪਣੇ AI ਉਤਪਾਦਾਂ ਲਈ ਇਹਨਾਂ ਕਦਮਾਂ ਦੀ ਵਰਤੋਂ ਕਰੋ:
- ਸਿਰਫ਼ ਸਿੰਗਲ ਪ੍ਰੋਂਪਟ (prompts) ਹੀ ਨਹੀਂ, ਸਗੋਂ ਅਸਲ ਉਪਭੋਗਤਾ ਦੇ ਕੰਮਾਂ ਦੇ ਆਲੇ-ਦੁਆਲੇ ਟੈਸਟ ਲਿਖੋ।
- ਆਪਣੇ ਟੈਸਟਾਂ ਵਿੱਚ ਫਾਈਲ ਲਿਖਣ, ਈਮੇਲ, ਜਾਂ ਭੁਗਤਾਨ ਵਰਗੇ ਟੂਲ ਐਕਸੈਸ ਨੂੰ ਸ਼ਾਮਲ ਕਰੋ।
- ਟੈਸਟ ਕਰੋ ਕਿ AI ਗਲਤੀਆਂ ਜਾਂ ਗੁੰਮ ਹੋਏ ਸੰਦਰਭ (context) ਤੋਂ ਕਿਵੇਂ ਉਭਰਦਾ ਹੈ।
- ਅਜਿਹੇ ਐਡਵਰਸੇਰੀਅਲ ਉਦਾਹਰਣਾਂ (adversarial examples) ਦੀ ਵਰਤੋਂ ਕਰੋ ਜੋ ਤੁਹਾਡੇ ਵਿਸ਼ੇਸ਼ ਉਤਪਾਦ ਨਾਲ ਮੇਲ ਖਾਂਦੀਆਂ ਹੋਣ।
- 'ਨੀਅਰ ਮਿਸਿਜ਼' (near misses) ਨੂੰ ਲੌਗ ਕਰੋ ਅਤੇ ਉਹਨਾਂ ਨੂੰ ਨਵੇਂ ਟੈਸਟਾਂ ਵਿੱਚ ਬਦਲੋ।
ਇਹ AI ਏਜੰਟਾਂ ਲਈ ਬਹੁਤ ਮਹੱਤਵਪੂਰਨ ਹੈ। ਇੱਕ ਚੈਟਬੋਟ ਟੈਕਸਟ ਵਿੱਚ ਗਲਤੀਆਂ ਕਰਦਾ ਹੈ। ਇੱਕ ਏਜੰਟ ਕਾਰਵਾਈ (action) ਕਰਦੇ ਸਮੇਂ ਗਲਤੀਆਂ ਕਰਦਾ ਹੈ। ਇਹ ਤੁਹਾਡੇ ਜੋਖਮ ਦੇ ਪੱਧਰ ਨੂੰ ਬਦਲ ਦਿੰਦਾ ਹੈ।
ਇੱਕ ਭਰੋਸੇਯੋਗ ਸਿਸਟਮ ਬਣਾਉਣ ਲਈ, ਇਸ ਫਰੇਮਵਰਕ ਦੀ ਪਾਲਣਾ ਕਰੋ:
- ਖ਼ਤਰਨਾਕ ਕਿਰਿਆਵਾਂ (verbs) ਦੀ ਸੂਚੀ ਬਣਾਓ: ਡਿਲੀਟ ਕਰਨਾ, ਭੇਜਣਾ, ਪ੍ਰਕਾਸ਼ਿਤ ਕਰਨਾ, ਚਾਰਜ ਕਰਨਾ, ਜਾਂ ਮਨਜ਼ੂਰੀ ਦੇਣਾ।
- ਭੂਮਿਕਾ-ਅਧਾਰਤ (role-based) ਸਥਿਤੀਆਂ ਬਣਾਓ: ਇੱਕ ਸ਼ੁਰੂਆਤ ਕਰਨ ਵਾਲੇ, ਇੱਕ ਪਾਵਰ ਯੂਜ਼ਰ, ਅਤੇ ਇੱਕ ਮਾੜੇ ਇਰਾਦੇ ਵਾਲੇ (malicious) ਉਪਭੋਗਤਾ ਦਾ ਟੈਸਟ ਕਰੋ।
- ਗੁੰਝਲਦਾਰ ਸੰਦਰਭ (messy context) ਦੀ ਵਰਤੋਂ ਕਰੋ: AI ਨੂੰ ਪੁਰਾਣਾ ਡੇਟਾ ਜਾਂ ਵਿਰੋਧੀ ਨਿਰਦੇਸ਼ ਦਿਓ।
- ਹਾਰਡ ਸਟੌਪਸ (hard stops) ਜੋੜੋ: ਅਜਿਹੀਆਂ ਕਾਰਵਾਈਆਂ ਤੋਂ ਪਹਿਲਾਂ ਮਨੁੱਖੀ ਸਮੀਖਿਆ (human review) ਲਾਜ਼ਮੀ ਕਰੋ ਜਿਨ੍ਹਾਂ ਨੂੰ ਵਾਪਸ ਨਹੀਂ ਲਿਆ ਜਾ ਸਕਦਾ।
- ਬੋਰਿੰਗ ਭਰੋਸੇਯੋਗਤਾ (boring reliability) ਨੂੰ ਟ੍ਰੈਕ ਕਰੋ: ਮਾਪੋ ਕਿ ਮਾਡਲ ਅਨਿਸ਼ਚਿਤਤਾ (uncertainty) ਨੂੰ ਕਿਵੇਂ ਸੰਭਾਲਦਾ ਹੈ।
ਮਕਸਦ AI ਨੂੰ ਡਰਪੋਕ ਬਣਾਉਣਾ ਨਹੀਂ ਹੈ। ਮਕਸਦ ਇਸਨੂੰ ਭਵਿੱਖਬਾਣੀਯੋਗ (predictable) ਬਣਾਉਣਾ ਹੈ।
ਕੋਈ ਵੀ ਸਿਮੂਲੇਸ਼ਨ ਸੰਪੂਰਨ ਨਹੀਂ ਹੁੰਦਾ। ਉਪਭੋਗਤਾ ਹਮੇਸ਼ਾ ਅਜਿਹੇ ਤਰੀਕੇ ਲੱਭ ਲੈਣਗੇ ਜਿਨ੍ਹਾਂ ਦੀ ਤੁਸੀਂ ਭਵਿੱਖਬਾਣੀ ਨਹੀਂ ਕੀਤੀ ਹੋਵੇਗੀ। ਤੁਹਾਨੂੰ ਲੇਅਰਾਂ (layers) ਦੀ ਲੋੜ ਹੈ: ਸਿਮੂਲੇਸ਼ਨ, ਸੀਮਤ ਰੋਲਆਊਟਸ (rollouts), ਨਿਗਰਾਨੀ, ਅਤੇ ਤੇਜ਼ ਰੋਲਬੈਕ (rollback) ਮਾਰਗ।
ਮਾਡਲ ਮੁਲਾਂਕਣ (Model evaluation) ਹੁਣ ਸਾਫਟਵੇਅਰ ਇੰਜੀਨੀਅਰਿੰਗ ਵਾਂਗ ਬਣ ਰਿਹਾ ਹੈ। ਇਹ ਸਥਿਤੀ-ਅਧਾਰਤ (scenario-driven) ਅਤੇ ਵਰਕਫਲੋ-ਜਾਗਰੂਕ (workflow-aware) ਹੋਣਾ ਚਾਹੀਦਾ ਹੈ।
ਤੁਹਾਨੂੰ ਕਿਸੇ ਰਿਸਰਚ ਲੈਬ ਦੀ ਲੋੜ ਨਹੀਂ ਹੈ। ਤੁਹਾਨੂੰ ਅਸਲ ਉਪਭੋਗਤਾ ਦੇ ਕੰਮਾਂ ਅਤੇ AI ਨੂੰ ਸਿਰਫ਼ ਇੱਕ ਟੈਕਸਟ ਜਨਰੇਟਰ ਵਜੋਂ ਨਹੀਂ, ਸਗੋਂ ਇੱਕ ਕਾਰਕ (actor) ਵਜੋਂ ਟੈਸਟ ਕਰਨ ਦੇ ਅਨੁਸ਼ਾਸਨ ਦੀ ਲੋੜ ਹੈ।
ਸਰੋਤ: https://dev.to/jenueldev/pre-launch-ai-simulations-are-becoming-the-new-model-safety-check-107e
ਵਿਕਲਪਿਕ ਲਰਨਿੰਗ ਕਮਿਊਨਿਟੀ: https://t.me/GyaanSetuAi