ਪ੍ਰੀ-ਲੌਂਚ AI ਸਿਮੂਲੇਸ਼ਨ ਨਵਾਂ ਸੇਫਟੀ ਚੈੱਕ ਹਨ

AI ਸੁਰੱਖਿਆ ਬਦਲ ਰਹੀ ਹੈ। ਇਹ ਚੇਤਾਵਨੀ ਲੇਬਲਾਂ ਤੋਂ ਰਿਹਰਸਲ (rehearsals) ਵੱਲ ਵਧ ਰਹੀ ਹੈ।

OpenAI ਨੇ ਹਾਲ ਹੀ ਵਿੱਚ ਰਿਲੀਜ਼ ਤੋਂ ਪਹਿਲਾਂ ਮਾਡਲ ਦੇ ਵਿਵਹਾਰ ਦੀ ਭਵਿੱਖਬਾਣੀ ਕਰਨ ਬਾਰੇ ਕੰਮ ਸਾਂਝਾ ਕੀਤਾ ਹੈ। ਉਹ ਡਿਪਲਾਈਮੈਂਟ ਸਿਮੂਲੇਸ਼ਨਾਂ (deployment simulations) ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹਨ। ਇਸਦਾ ਮਤਲਬ ਹੈ ਕਿ ਕਰੋੜਾਂ ਉਪਭੋਗਤਾਵਾਂ ਤੱਕ ਪਹੁੰਚਣ ਤੋਂ ਪਹਿਲਾਂ ਇਹ ਟੈਸਟ ਕਰਨਾ ਕਿ ਲੋਕ, ਟੀਮਾਂ ਅਤੇ ਹਮਲਾਵਰ ਇੱਕ ਮਾਡਲ ਦੀ ਵਰਤੋਂ ਕਿਵੇਂ ਕਰਦੇ ਹਨ।

ਉਦਯੋਗ ਬਦਲ ਰਿਹਾ ਹੈ। ਅਸੀਂ ਇੱਕ ਮਾਡਲ ਨੂੰ ਲਾਂਚ ਕਰਨ ਅਤੇ ਗਲਤੀਆਂ ਦੀ ਨਿਗਰਾਨੀ ਕਰਨ ਦੀ ਬਜਾਏ, ਲਾਂਚ ਤੋਂ ਪਹਿਲਾਂ ਗਲਤੀਆਂ ਦਾ ਸਿਮੂਲੇਸ਼ਨ ਕਰਨ ਵੱਲ ਵਧ ਰਹੇ ਹਾਂ। ਇਹ ਇੱਕ ਅਜਿਹੀ ਆਦਤ ਹੈ ਜਿਸਨੂੰ ਹਰ ਪ੍ਰੋਡਕਟ ਟੀਮ ਨੂੰ ਅਪਣਾਉਣਾ ਚਾਹੀਦਾ ਹੈ।

ਸਟੈਂਡਰਡ ਬੈਂਚਮਾਰਕਸ ਅਤੇ ਰੈੱਡ-ਟੀਮਿੰਗ (red-teaming) ਕਾਫ਼ੀ ਨਹੀਂ ਹਨ। ਅਸਲ ਵਰਕਫਲੋਅ ਦੇ ਅੰਦਰ ਮਾਡਲ ਵੱਖਰੇ ਤਰੀਕੇ ਨਾਲ ਕੰਮ ਕਰਦੇ ਹਨ। ਹੈਲਥਕੇਅਰ ਵਿੱਚ ਇੱਕ ਚੈਟਬੋਟ, ਡਾਟਾਬੇਸ ਐਕਸੈਸ ਵਾਲੇ ਕੋਡਿੰਗ ਏਜੰਟ ਨਾਲੋਂ ਵੱਖਰਾ ਮਹਿਸੂਸ ਹੁੰਦਾ ਹੈ। ਮਾਡਲ ਉਹੀ ਰਹਿੰਦਾ ਹੈ, ਪਰ ਜੋਖਮ ਬਦਲ ਜਾਂਦੇ ਹਨ।

ਡਿਪਲਾਈਮੈਂਟ ਸਿਮੂਲੇਸ਼ਨ ਪੂਰੀ ਸਥਿਤੀ ਦਾ ਟੈਸਟ ਕਰਦਾ ਹੈ। ਤੁਸੀਂ ਇਹ ਪੁੱਛਣਾ ਬੰਦ ਕਰ ਦਿੰਦੇ ਹੋ ਕਿ ਕੀ ਇੱਕ ਮਾਡਲ ਪ੍ਰੋਂਪਟ (prompt) ਦਾ ਜਵਾਬ ਦੇ ਸਕਦਾ ਹੈ। ਤੁਸੀਂ ਇਹ ਪੁੱਛਣਾ ਸ਼ੁਰੂ ਕਰਦੇ ਹੋ ਕਿ ਜਦੋਂ ਕੋਈ ਖਾਸ ਉਪਭੋਗਤਾ ਦਬਾਅ ਹੇਠ ਇੱਕ ਖਾਸ ਟੂਲ ਦੀ ਵਰਤੋਂ ਕਰਦਾ ਹੈ ਤਾਂ ਕੀ ਹੁੰਦਾ ਹੈ।

ਇਹ ਕਰਨ ਲਈ ਤੁਹਾਨੂੰ ਕਿਸੇ ਵੱਡੀ ਰਿਸਰਚ ਲੈਬ ਦੀ ਲੋੜ ਨਹੀਂ ਹੈ। ਤੁਸੀਂ ਇਹਨਾਂ ਕਦਮਾਂ ਨਾਲ ਛੋਟੀ ਸ਼ੁਰੂਆਤ ਕਰ ਸਕਦੇ ਹੋ:

ਇਹ AI ਏਜੰਟਾਂ ਲਈ ਬਹੁਤ ਜ਼ਰੂਰੀ ਹੈ। ਇੱਕ ਚੈਟਬੋਟ ਗਲਤ ਜਵਾਬ ਦਿੰਦਾ ਹੈ। ਇੱਕ ਏਜੰਟ ਗਲਤ ਕਾਰਵਾਈ ਕਰਦਾ ਹੈ। ਇਹ ਜੋਖਮ ਦੇ ਪੱਧਰ ਨੂੰ ਬਦਲ ਦਿੰਦਾ ਹੈ।

ਜੇਕਰ ਤੁਸੀਂ ਕੋਈ ਸਟਾਰਟਅੱਪ ਜਾਂ ਅੰਦਰੂਨੀ ਟੂਲ ਬਣਾ ਰਹੇ ਹੋ, ਤਾਂ ਇਸ ਫਰੇਮਵਰਕ ਦੀ ਵਰਤੋਂ ਕਰੋ:

ਮਕਸਦ AI ਨੂੰ ਡਰਪੋਕ ਬਣਾਉਣਾ ਨਹੀਂ ਹੈ। ਮਕਸਦ ਇਸਨੂੰ ਭਵਿੱਖਬਾਣੀਯੋਗ (predictable) ਬਣਾਉਣਾ ਹੈ।

ਕੋਈ ਵੀ ਸਿਮੂਲੇਸ਼ਨ ਸੰਪੂਰਨ ਨਹੀਂ ਹੁੰਦਾ। ਉਪਭੋਗਤਾ ਹਮੇਸ਼ਾ ਤੁਹਾਡੇ ਸਿਸਟਮ ਨੂੰ ਤੋੜਨ ਦੇ ਤਰੀਕੇ ਲੱਭ ਲੈਣਗੇ। ਇੱਕ ਲੇਅਰਡ (layered) ਪਹੁੰਚ ਦੀ ਵਰਤੋਂ ਕਰੋ: ਪ੍ਰੀ-ਲੌਂਚ ਸਿਮੂਲੇਸ਼ਨ, ਸੀਮਤ ਰੋਲਆਊਟਸ, ਲਗਾਤਾਰ ਨਿਗਰਾਨੀ, ਅਤੇ ਤੇਜ਼ ਰੋਲਬੈਕ (rollback) ਮਾਰਗ।

ਮਾਡਲ ਮੁਲਾਂਕਣ (evaluation) ਹੁਣ ਸਾਫਟਵੇਅਰ ਇੰਜੀਨੀਅਰਿੰਗ ਵਾਂਗ ਬਣ ਰਿਹਾ ਹੈ। ਇਹ ਸਥਿਤੀਆਂ-ਅਧਾਰਤ (scenario-driven) ਅਤੇ ਵਰਕਫਲੋ-ਜਾਗਰੂਕ ਹੈ। ਤੁਹਾਨੂੰ ਕਿਸੇ ਲੈਬ ਦੀ ਲੋੜ ਨਹੀਂ ਹੈ। ਤੁਹਾਨੂੰ ਅਸਲ ਉਪਭੋਗਤਾ ਦੇ ਕੰਮਾਂ ਅਤੇ AI ਨੂੰ ਸਿਰਫ਼ ਇੱਕ ਟੈਕਸਟ ਜਨਰੇਟਰ ਵਜੋਂ ਨਹੀਂ, ਸਗੋਂ ਇੱਕ ਕਾਰਕ (actor) ਵਜੋਂ ਟੈਸਟ ਕਰਨ ਦੇ ਅਨੁਸ਼ਾਸਨ ਦੀ ਲੋੜ ਹੈ।

Source: https://dev.to/jenueldev/pre-launch-ai-simulations-are-becoming-the-new-model-safety-check-107e