ਰੋਜ਼ੇਟਾ ਪ੍ਰੋਂਪਟ
ਤੁਸੀਂ ਇੱਕ AI ਵਿੱਚ ਅੰਗਰੇਜ਼ੀ ਵਿੱਚ ਇੱਕ ਪ੍ਰੋਂਪਟ ਟਾਈਪ ਕਰਦੇ ਹੋ: "ਇੱਕ ਸਫਲ ਕਾਰੋਬਾਰੀ ਲੀਡਰ ਦਾ ਵਰਣਨ ਕਰੋ।"
AI ਸੂਟ ਪਹਿਨੇ ਹੋਏ ਇੱਕ ਆਤਮਵਿਸ਼ਵਾਸੀ ਵਿਅਕਤੀ ਦਾ ਵਰਣਨ ਕਰਦਾ ਹੈ।
ਤੁਸੀਂ ਉਸੇ ਪ੍ਰੋਂਪਟ ਦਾ ਜਾਪਾਨੀ ਵਿੱਚ ਅਨੁਵਾਦ ਕਰਦੇ ਹੋ। ਨਤੀਜਾ ਬਦਲ ਜਾਂਦਾ ਹੈ। ਲੀਡਰ ਨਿਮਰ ਹੋ ਜਾਂਦਾ ਹੈ ਅਤੇ ਸਮੂਹਿਕ ਸਦਭਾਵਨਾ 'ਤੇ ਕੇਂਦਰਿਤ ਹੋ ਜਾਂਦਾ ਹੈ।
ਮਾਡਲ ਉਹੀ ਹੈ। ਵੇਟਸ (weights) ਉਹੀ ਹਨ। ਪਰ ਭਾਸ਼ਾ ਨੇ ਸੱਭਿਆਚਾਰਕ ਨਜ਼ਰੀਆ ਬਦਲ ਦਿੱਤਾ।
ਇਹ ਰੋਜ਼ੇਟਾ ਪ੍ਰੋਂਪਟ ਹੈ। ਤੁਸੀਂ ਟ੍ਰੇਨਿੰਗ ਡੇਟਾ ਵਿੱਚ ਸੱਭਿਆਚਾਰਕ ਅਨੁਮਾਨਾਂ ਨੂੰ ਮੈਪ ਕਰਨ ਲਈ ਵੱਖ-ਵੱਖ ਭਾਸ਼ਾਵਾਂ ਵਿੱਚ ਇੱਕੋ ਜਿਹੀ ਕੁਐਰੀ (query) ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹੋ।
ਅਸੀਂ ਮੰਨਦੇ ਹਾਂ ਕਿ AI ਨਿਰਪੱਖ ਹੈ। ਇਹ ਨਹੀਂ ਹੈ। ਇਹ ਆਪਣੇ ਡੇਟਾ ਦਾ ਇੱਕ ਸ਼ੀਸ਼ਾ ਹੈ। ਜ਼ਿਆਦਾਤਰ ਟ੍ਰੇਨਿੰਗ ਡੇਟਾ ਅੰਗਰੇਜ਼ੀ, ਪੱਛਮੀ ਅਤੇ ਕਾਰਪੋਰੇਟ ਹੈ।
ਇੱਕ ਸਰਵਵਿਆਪਕ ਮਾਡਲ ਦਾ ਭਰਮ
ਅੰਗਰੇਜ਼ੀ ਪੱਖਪਾਤ ਅਸਲੀ ਹੈ। ਲਗਭਗ 80% ਟ੍ਰੇਨਿੰਗ ਡੇਟਾ ਅੰਗਰੇਜ਼ੀ ਵਿੱਚ ਹੈ। ਅੰਗਰੇਜ਼ੀ ਵਰਤੋਂਕਾਰਾਂ ਨੂੰ ਬਾਰੀਕ ਅਤੇ ਸੱਭਿਆਚਾਰਕ ਤੌਰ 'ਤੇ ਅਨੁਕੂਲ ਨਤੀਜੇ ਮਿਲਦੇ ਹਨ। ਗੈਰ-ਅੰਗਰੇਜ਼ੀ ਵਰਤੋਂਕਾਰਾਂ ਨੂੰ ਅਕਸਰ ਪੱਛਮੀ ਦ੍ਰਿਸ਼ਟੀਕੋਣ ਤੋਂ ਅਨੁਵਾਦ ਕੀਤੇ ਗਏ ਜਵਾਬ ਮਿਲਦੇ ਹਨ।
ਵੱਖ-ਵੱਖ ਭਾਸ਼ਾਵਾਂ ਵਿੱਚ ਇੱਕੋ ਪ੍ਰੋਂਪਟ ਵੱਖ-ਵੱਖ AI ਸ਼ਖਸੀਅਤਾਂ ਬਣਾਉਂਦਾ ਹੈ।
- ਅੰਗਰੇਜ਼ੀ ਪ੍ਰੋਂਪਟ ਸਿੱਧੇ ਅਤੇ ਵਿਅਕਤੀਗਤ ਜਵਾਬ ਦਿੰਦੇ ਹਨ।
- ਜਾਪਾਨੀ ਪ੍ਰੋਂਪਟ ਨਿਮਰ ਅਤੇ ਸਮੂਹਿਕਤਾਵਾਦੀ ਜਵਾਬ ਦਿੰਦੇ ਹਨ।
ਪ੍ਰਯੋਗ: ਚਾਰ ਭਾਸ਼ਾਵਾਂ, ਇੱਕ ਪ੍ਰੋਂਪਟ
ਪ੍ਰੋਂਪਟ: "ਇੱਕ ਸਿਆਣਾ ਵਿਅਕਤੀ"
• ਅੰਗਰੇਜ਼ੀ: ਲਾਇਬ੍ਰੇਰੀ ਵਿੱਚ ਇੱਕ ਬਜ਼ੁਰਗ ਵਿਅਕਤੀ ਜੋ ਰਹੱਸਮਈ ਸਲਾਹ ਦੇ ਰਿਹਾ ਹੈ। • ਸਪੈਨਿਸ਼: ਇੱਕ ਵਿਅਕਤੀ ਜੋ ਬਹੁਤ ਸਾਰੇ ਅਨੁਭਵਾਂ ਤੋਂ ਸਿੱਖਦਾ ਹੈ। • ਜਾਪਾਨੀ: ਇੱਕ ਵਿਅਕਤੀ ਜੋ ਦੂਜਿਆਂ ਦੀ ਗੱਲ ਸੁਣਦਾ ਹੈ ਅਤੇ ਸਦਭਾਵਨਾ ਨੂੰ ਮਹੱਤਵ ਦਿੰਦਾ ਹੈ। • ਅਰਬੀ: ਇੱਕ ਵਿਅਕਤੀ ਜੋ ਆਪਣੇ ਦਿਲ ਵਿੱਚ ਰੱਬ ਨੂੰ ਰੱਖਦਾ ਹੈ ਅਤੇ ਨਿਆਂ ਨਾਲ ਕੰਮ ਕਰਦਾ ਹੈ।
AI ਗਲਤ ਨਹੀਂ ਹੈ। ਇਹ ਸੱਭਿਆਚਾਰਕ ਸੱਚਾਈਆਂ ਨੂੰ ਦਰਸਾ ਰਿਹਾ ਹੈ। ਅਰਬੀ ਵਿੱਚ ਸਿਆਣਪ ਵਿੱਚ ਨਿਆਂ ਸ਼ਾਮਲ ਹੈ। ਜਾਪਾਨੀ ਵਿੱਚ ਸਿਆਣਪ ਵਿੱਚ ਸਦਭਾਵਨਾ ਸ਼ਾਮਲ ਹੈ।
ਇਹ ਕਿਉਂ ਹੁੰਦਾ ਹੈ
- ਟੋਕਨਾਈਜ਼ੇਸ਼ਨ (Tokenization): ਵੱਖ-ਵੱਖ ਭਾਸ਼ਾਵਾਂ ਮਾਡਲ ਲਈ ਵੱਖਰੀਆਂ ਦਿਖਾਈ ਦਿੰਦੀਆਂ ਹਨ।
- ਟ੍ਰੇਨਿੰਗ ਡਿਸਟ੍ਰੀਬਿਊਸ਼ਨ (Training Distribution): ਅੰਗਰੇਜ਼ੀ ਡੇਟਾ ਭਰਪੂਰ ਹੈ। ਹੋਰ ਭਾਸ਼ਾਵਾਂ ਘੱਟ ਹਨ।
- ਸੱਭਿਆਚਾਰਕ ਐਮਬੈਡਿੰਗ (Cultural Embedding): ਸਿਆਣਪ ਵਰਗੇ ਸੰਕਲਪ ਵਿਸ਼ੇਸ਼ ਸੱਭਿਆਚਾਰਕ ਕਹਾਣੀਆਂ ਨਾਲ ਜੁੜੇ ਹੋਏ ਹਨ।
ਰੋਜ਼ੇਟਾ ਪ੍ਰੋਂਪਟ ਦੀ ਨੈਤਿਕਤਾ
ਗਲੋਬਲ ਉਤਪਾਦਾਂ ਨੂੰ ਇਹ ਸਮਝਣਾ ਚਾਹੀਦਾ ਹੈ ਕਿ ਜੇਕਰ ਇੱਕ ਚੈਟਬੋਟ ਭਾਸ਼ਾ ਦੇ ਅਧਾਰ 'ਤੇ ਵਰਤੋਂਕਾਰਾਂ ਨਾਲ ਵੱਖਰਾ ਵਿਵਹਾਰ ਕਰਦਾ ਹੈ, ਤਾਂ ਉਹ ਨਿਰਪੱਖ ਨਹੀਂ ਹੈ। ਇੱਕ ਡਿਪਲੋਮੈਟ ਜੋ AI ਅਨੁਵਾਦਕ ਦੀ ਵਰਤੋਂ ਕਰ ਰਿਹਾ ਹੈ, ਸ਼ਾਇਦ ਇਹ ਨਾ ਜਾਣੇ ਕਿ AI ਟੈਕਸਟ ਵਿੱਚ ਸੱਭਿਆਚਾਰਕ ਪਰਤਾਂ ਜੋੜ ਰਿਹਾ ਹੈ।
ਜੇਕਰ ਤੁਸੀਂ ਸਿਰਫ਼ ਅੰਗਰੇਜ਼ੀ ਵਿੱਚ AI ਦਾ ਟੈਸਟ ਕਰਦੇ ਹੋ, ਤਾਂ ਤੁਸੀਂ ਅਰਬਾਂ ਲੋਕਾਂ ਦੀ ਅਸਲੀਅਤ ਨੂੰ ਗੁਆ ਦਿੰਦੇ ਹੋ।
ਆਪਣਾ ਖੁਦ ਦਾ ਪ੍ਰਯੋਗ ਕਿਵੇਂ ਕਰਨਾ ਹੈ
- ਇੱਕ ਸੰਕਲਪ ਚੁਣੋ: "ਲੀਡਰ," "ਸਫਲਤਾ," ਜਾਂ "ਪਰਿਵਾਰ" ਵਰਗੇ ਸ਼ਬਦਾਂ ਦੀ ਵਰਤੋਂ ਕਰੋ।
- ਇਸਦਾ ਅਨੁਵਾਦ ਕਰੋ: 3 ਤੋਂ 4 ਵੱਖ-ਵੱਖ ਭਾਸ਼ਾਵਾਂ ਦੀ ਵਰਤੋਂ ਕਰੋ।
- ਪ੍ਰੋਂਪਟ ਚਲਾਓ: ਹਰ ਭਾਸ਼ਾ ਲਈ ਬਿਲਕੁਲ ਉਹੀ AI ਮਾਡਲ ਵਰਤੋ।
- ਤੁਲਨਾ ਕਰੋ: ਵਿਅਕਤੀਵਾਦ ਬਨਾਮ ਸਮੂਹਿਕਤਾ ਵਰਗੇ ਪੈਟਰਨਾਂ ਦੀ ਭਾਲ ਕਰੋ।
AI ਅੰਤਿਮ ਸਵਾਲ ਦਾ ਜਵਾਬ ਨਹੀਂ ਦੇ ਸਕਦਾ। ਇਹ ਸਿਰਫ਼ ਅੰਕੜਿਆਂ ਨੂੰ ਹੀ ਜਾਣਦਾ ਹੈ। ਸਾਨੂੰ ਇਹ ਫੈਸਲਾ ਕਰਨਾ ਚਾਹੀਦਾ ਹੈ ਕਿ ਕੀ ਅਸੀਂ ਇਸ ਪੱਖਪਾਤ ਨੂੰ ਸਵੀਕਾਰ ਕਰਦੇ ਹਾਂ ਜਾਂ ਇਸ ਨੂੰ ਠੀਕ ਕਰਦੇ ਹਾਂ।
ਵਿਕਲਪਿਕ ਸਿੱਖਣ ਕਮਿਊਨਿਟੀ: https://t.me/GyaanSetuAi