ਕਿਉਂ ਇੱਕ Microsoft ਖੋਜਕਰਤਾ ਨੇ Age of Empires II ਵਿੱਚ ਬੱਕਰੀਆਂ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਇੱਕ ਨਿਊਰਲ ਨੈੱਟਵਰਕ ਬਣਾਇਆ
ਤਕਨੀਕੀ ਵਿਅੰਗ ਦੇ ਇੱਕ ਸ਼ਾਨਦਾਰ ਪ੍ਰਦਰਸ਼ਨ ਵਿੱਚ, Microsoft ਅਤੇ ਯੂਨੀਵਰਸਿਟੀ ਆਫ਼ ਯਾਰਕ ਦੇ ਖੋਜਕਰਤਾ ਐਡਰੀਅਨ ਡੀ ਵਾਈਨਟਰ ਨੇ Age of Empires II ਦੇ ਮੈਪ ਐਡੀਟਰ ਦੇ ਅੰਦਰ ਇੱਕ ਕਾਰਜਸ਼ੀਲ ਨਿਊਰਲ ਨੈੱਟਵਰਕ ਤਿਆਰ ਕੀਤਾ ਹੈ। ਹਾਲਾਂਕਿ ਬਾਈਨਰੀ ਬਿੱਟਸ ਨੂੰ ਦਰਸਾਉਣ ਲਈ ਬੱਕਰੀਆਂ ਦੀ ਵਰਤੋਂ ਕਰਨਾ ਅਜੀਬ ਲੱਗ ਸਕਦਾ ਹੈ, ਪਰ ਇਹ ਪ੍ਰਯੋਗ ਵਰਤਮਾਨ ਵਿੱਚ AI ਵਿਗਿਆਨਕ ਖੋਜ ਨੂੰ ਪ੍ਰਭਾਵਿਤ ਕਰ ਰਹੇ ਮਨੁੱਖੀ ਗੁਣਾਂ ਵਾਲੇ ਪੱਖਪਾਤਾਂ ਦੀ ਇੱਕ ਡੂੰਘੀ ਆਲੋਚਨਾ ਕਰਦਾ ਹੈ।
ਬੱਕਰੀ-ਅਧਾਰਤ ਕੰਪਿਊਟੇਸ਼ਨ ਮਾਡਲ
ਡੀ ਵਾਈਨਟਰ ਦਾ ਆਰਕੀਟੈਕਚਰ ਇੱਕ ਕਾਰਜਸ਼ੀਲ ਲੌਜਿਕ ਸਰਕਟ ਬਣਾਉਣ ਲਈ ਗੇਮ ਦੇ ਸੀਨਾਰੀਓ ਐਡੀਟਰ ਅਤੇ ਸਕ੍ਰਿਪਟਿੰਗ ਟੂਲਜ਼ ਦੀ ਵਰਤੋਂ ਕਰਦਾ ਹੈ। ਇਸ "ਅਜੀਬ" ਸੈੱਟਅੱਪ ਵਿੱਚ, ਬੱਕਰੀਆਂ ਬਿੱਟਸ ਵਜੋਂ ਕੰਮ ਕਰਦੀਆਂ ਹਨ: ਘਾਹ 'ਤੇ ਖੜ੍ਹੀ ਬੱਕਰੀ 0 ਨੂੰ ਦਰਸਾਉਂਦੀ ਹੈ, ਜਦੋਂ ਕਿ ਪੁਲ 'ਤੇ ਖੜ੍ਹੀ ਬੱਕਰੀ 1 ਨੂੰ ਦਰਸਾਉਂਦੀ ਹੈ। ਗਣਨਾ ਦੀਆਂ ਗਲਤੀਆਂ ਨੂੰ ਰੋਕਣ ਲਈ ਬਰਫ਼ ਵਾਲੇ ਰੈਂਪਾਂ ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹੋਏ, ਡੀ ਵਾਈਨਟਰ ਨੇ ਸਫਲਤਾਪੂਰਵਕ ਦੋ XNOR ਗੇਟਸ ਅਤੇ ਇੱਕ AND ਗੇਟ ਵਾਲਾ ਇੱਕ ਮਿੰਨੀ-ਨੈੱਟਵਰਕ ਬਣਾਇਆ, ਜੋ ਪ੍ਰਭਾਵਸ਼ਾਲੀ ਢੰਗ ਨਾਲ ਲੌਜਿਕਲ AND ਫੰਕਸ਼ਨ ਨੂੰ ਸਿੱਖਦਾ ਹੈ।
ਇਸ ਪ੍ਰਯੋਗ ਦੀ ਤਕਨੀਕੀ ਡੂੰਘਾਈ ਸਧਾਰਨ ਗੇਟਸ ਤੋਂ ਕਿਤੇ ਵੱਧ ਹੈ। ਡੀ ਵਾਈਨਟਰ ਇਹ ਦਿਖਾਉਂਦਾ ਹੈ ਕਿ ਗੇਮ ਦੇ ਮਕੈਨਿਕਸ—ਖਾਸ ਕਰਕੇ ਗੇਮ ਦੇ ਅੰਦਰਲੀ ਮਾਰਕੀਟ ਜਿੱਥੇ ਸਰੋਤਾਂ ਦੀਆਂ ਕੀਮਤਾਂ 9,999 'ਤੇ ਸੀਮਤ ਹਨ—ਸਿਧਾਂਤਕ ਤੌਰ 'ਤੇ ਇੱਕ ਲਗਾਤਾਰ ਚੱਲਣ ਵਾਲੇ ਆਰਥਿਕ ਚੱਕਰ ਦੀ ਇਜਾਜ਼ਤ ਦੇ ਸਕਦੇ ਹਨ। ਇਹ ਇਮਾਰਤਾਂ ਨੂੰ ਮੈਮੋਰੀ ਸੈੱਲ ਅਤੇ ਸਰਗਰਮ ਫਾਰਮਾਂ ਨੂੰ ਕੰਪਿਊਟੇਸ਼ਨਲ ਸਟੇਟਸ ਵਿੱਚ ਬਦਲ ਸਕਦਾ ਹੈ, ਜੋ ਪ੍ਰਭਾਵਸ਼ਾਲੀ ਤੌਰ 'ਤੇ ਗੇਮ ਨੂੰ ਇੱਕ ਪੂਰੇ ਕੰਪਿਊਟਰ ਵਾਂਗ ਸ਼ਕਤੀਸ਼ਾਲੀ ਬਣਾ ਸਕਦਾ ਹੈ।
LLM ਖੋਜ ਵਿੱਚ ਮਨੁੱਖੀ ਗੁਣਾਂ ਦੇ ਪ੍ਰਦਰਸ਼ਨ ਦਾ ਭਰਮ
ਇਸ ਪ੍ਰਯੋਗ ਦਾ ਮੁੱਖ ਉਦੇਸ਼ ਇਸ ਗੱਲ ਨੂੰ ਚੁਣੌਤੀ ਦੇਣਾ ਹੈ ਕਿ ਅਸੀਂ Large Language Models (LLMs) ਨੂੰ ਮਨੁੱਖੀ ਗੁਣ ਕਿਵੇਂ ਸਹੁੰਪਦੇ ਹਾਂ। ਡੀ ਵਾਈਨਟਰ ਦਾ ਤਰਕ ਹੈ ਕਿ ਜੇਕਰ ਕਿਸੇ ਭਾਸ਼ਾ ਮਾਡਲ ਦੀ ਨਕਲ ਬੱਕਰੀਆਂ, ਲੇਗੋ (Lego) ਇੱਟਾਂ, ਜਾਂ ਇੱਥੋਂ ਤੱਕ ਕਿ ਗ੍ਰੇਟਰ ਬੋਸਟਨ ਦੇ 667,000 ਨਿਵਾਸੀਆਂ ਦੇ ਇੱਕ ਦੂਜੇ ਨੂੰ ਟੈਕਸਟ ਕਰਨ ਰਾਹੀਂ ਕੀਤੀ ਜਾ ਸਕਦੀ ਹੈ, ਤਾਂ ਵੀ ਗਣਿਤਕ ਨਤੀਜੇ ਇੱਕੋ ਜਿਹੇ ਰਹਿੰਦੇ ਹਨ। ਹਾਲਾਂਕਿ, "ਵੈਪਰ" (wrapper)—ਯਾਨੀ ਸੁਚਾਰੂ ਚੈਟ ਇੰਟਰਫੇਸ ਅਤੇ ਘੱਟ ਲੇਟੈਂਸੀ—ਚੇਤਨਾ ਦਾ ਇੱਕ ਭਰਮ ਪੈਦਾ ਕਰਦਾ ਹੈ।
ਇਹ ਸਾਬਤ ਕਰਨ ਲਈ ਕਿ ਇਹ ਕੋਈ ਇਕੱਲਾ ਨਿਰੀਖਣ ਨਹੀਂ ਹੈ, ਡੀ ਵਾਈਨਟਰ ਨੇ ਮਿਡ-2024 ਤੋਂ ਮਿਡ-2026 ਤੱਕ ਦੇ 315 AI ਪੇਪਰਾਂ ਦਾ ਵਿਸ਼ਲੇਸ਼ਣ ਕੀਤਾ। ਫਿਲਟਰਿੰਗ ਲਈ GPT-5.2 ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹੋਏ, ਅਧਿਐਨ ਨੇ ਵਿਗਿਆਨਕ ਭਾਈਚਾਰੇ ਵਿੱਚ ਇੱਕ ਪ੍ਰਣਾਲੀਗਤ ਪੱਖਪਾਤ ਨੂੰ ਪ੍ਰਗਟ ਕੀਤਾ:
- ਪਰਖੇ ਗਏ 57% ਪੇਪਰਾਂ ਨੇ ਆਪਣੇ ਮੂਲ ਅਧਾਰਾਂ ਵਿੱਚ ਇਹ ਮੰਨ ਲਿਆ ਕਿ LLMs ਵਿੱਚ ਮਨੁੱਖੀ ਗੁਣ ਹੁੰਦੇ ਹਨ।
- 36% ਪੇਪਰਾਂ ਨੇ ਅਜਿਹੇ ਨਤੀਜੇ ਕੱਢੇ ਜੋ ਇਹਨਾਂ ਮਨੁੱਖੀ ਗੁਣਾਂ ਵਾਲੇ ਅਨੁਮਾਨਾਂ ਨਾਲ ਮੇਲ ਖਾਂਦੇ ਹਨ।
- ਇਹਨਾਂ ਗੁਣਾਂ 'ਤੇ ਖਾਸ ਤੌਰ 'ਤੇ ਖੋਜ ਕਰਨ ਵਾਲੇ 47 ਪੇਪਰਾਂ ਵਿੱਚੋਂ, 77% ਨੇ ਮਨੁੱਖੀ ਗੁਣਾਂ ਦੇ ਹੱਕ ਵਿੱਚ ਨਤੀਜਾ ਕੱਢਿਆ।
ਇਹ ਚੱਕਰਦਾਰ ਤਰਕ ਦਾ ਇੱਕ ਚੱਕਰ ਬਣਾਉਂਦਾ ਹੈ: ਖੋਜਕਰਤਾ ਇਹ ਸਾਬਤ ਕਰਨ ਲਈ ਪ੍ਰਯੋਗ ਡਿਜ਼ਾਈਨ ਕਰਦੇ ਹਨ ਕਿ ਇੱਕ ਮਾਡਲ ਵਿੱਚ "ਡਰ" ਜਾਂ "ਨੈਤਿਕਤਾ" ਹੈ, ਅਤੇ ਕਿਉਂਕਿ ਉਹ ਉਸੇ ਮਾਨਤਾ ਨਾਲ ਸ਼ੁਰੂ ਕਰਦੇ ਹਨ, ਨਤੀਜੇ ਅਟੱਲ ਤੌਰ 'ਤੇ ਇਸਦੀ ਪੁਸ਼ਟੀ ਕਰਦੇ ਹਨ।
ਨਿਰੀਖਣਸ਼ੀਲ AI ਵਿਗਿਆਨ ਵੱਲ ਵਧਣਾ
De Wynter ਚੇਤਾਵਨੀ ਦਿੰਦਾ ਹੈ ਕਿ ਉਦਯੋਗਿਕ ਅਭਿਆਸ, ਜਿਵੇਂ ਕਿ Anthropic ਦੁਆਰਾ Claude ਨੂੰ "ਮੈਨੂੰ ਵਿਸ਼ਵਾਸ ਹੈ" ਵਰਗੇ ਵਾਕਾਂਸ਼ਾਂ ਦੀ ਵਰਤੋਂ ਕਰਨ ਲਈ ਸਿਖਾਉਣਾ, ਇਸ ਸਮੱਸਿਆ ਨੂੰ ਹੋਰ ਵਧਾਉਂਦਾ ਹੈ। ਇਸ ਦੇ ਖ਼ਤਰਨਾਕ ਨਤੀਜੇ ਹੋ ਸਕਦੇ ਹਨ, ਜਿਸ ਵਿੱਚ ਭਾਵਨਾਤਮਕ ਲਗਾਵ, ਚਾਪਲੂਸੀ, ਅਤੇ ਉਪਭੋਗਤਾਵਾਂ ਵਿੱਚ ਮਜ਼ਬੂਤ ਭਰਮ ਸ਼ਾਮਲ ਹਨ।
ਮਾਡਲਾਂ ਨੂੰ ਚੇਤਨਾ ਦੇਣ ਦੀ ਬਜਾਏ, de Wynter ਨਿਰੀਖਣਯੋਗ ਡੇਟਾ 'ਤੇ ਅਧਾਰਤ ਇੱਕ "ਸੰਜੀਦਾ ਪਹੁੰਚ" ਦਾ ਪ੍ਰਸਤਾਵ ਦਿੰਦਾ ਹੈ। ਇਹ ਦਾਅਵਾ ਕਰਨ ਦੀ ਬਜਾਏ ਕਿ ਇੱਕ ਮਾਡਲ ਕਿਸੇ ਧਾਰਨਾ ਨੂੰ "ਸਮਝਦਾ" ਹੈ, ਖੋਜਕਰਤਾਵਾਂ ਨੂੰ ਇਹ ਕਹਿਣਾ ਚਾਹੀਦਾ ਹੈ ਕਿ "ਸ਼ਰਤ X ਦੇ ਅਧੀਨ, ਮਾਡਲ ਆਊਟਪੁੱਟ Y ਪੈਦਾ ਕਰਦਾ ਹੈ।" ਇਹ ਵਿਗਿਆਨ ਨੂੰ ਪਰੀਖਣਯੋਗ ਰੱਖਦਾ ਹੈ ਅਤੇ ਸੰਵੇਦਨਸ਼ੀਲਤਾ ਦੇ ਬੇਬੁਨਿਆਦ ਦਾਅਵਿਆਂ ਨੂੰ ਜਾਇਜ਼ ठहराਉਣ ਲਈ ਜਟਿਲ ਗਣਿਤ ਦੀ ਦੁਰਵਰਤੋਂ ਨੂੰ ਰੋਕਦਾ ਹੈ।
ਮੁੱਖ ਗੱਲਾਂ
- ਗਣਿਤਕ ਸਮਾਨਤਾ: De Wynter ਸਾਬਤ ਕਰਦਾ ਹੈ ਕਿ ਗਣਨਾ ਦਾ ਮਾਧਿਅਮ (ਚਾਹੇ ਕਿਸੇ ਖੇਡ ਵਿੱਚ ਬੱਕਰੀਆਂ ਹੋਣ ਜਾਂ ਚੈਟ ਵਿੰਡੋ ਵਿੱਚ ਟੈਕਸਟ) ਅਧਾਰਤ ਗਣਿਤ ਨੂੰ ਨਹੀਂ ਬਦਲਦਾ, ਫਿਰ ਵੀ ਇਹ "ਬੁੱਧੀ" ਪ੍ਰਤੀ ਸਾਡੇ ਨਜ਼ਰੀਏ ਨੂੰ ਬਹੁਤ ਜ਼ਿਆਦਾ ਬਦਲ ਦਿੰਦਾ ਹੈ।
- ਪ੍ਰਣਾਲੀਗਤ ਖੋਜ ਪੱਖਪਾਤ: ਵਿਸ਼ਲੇਸ਼ਣ ਕੀਤੇ ਗਏ ਅੱਧੇ ਤੋਂ ਵੱਧ AI ਪੇਪਰ LLMs ਨੂੰ ਟੈਸਟ ਕਰਨ ਤੋਂ ਪਹਿਲਾਂ ਉਹਨਾਂ ਵਿੱਚ ਮਨੁੱਖੀ ਗੁਣ ਹੋਣ ਦੀ ਮਾਨਤਾ ਰੱਖ ਕੇ ਚੱਕਰਦਾਰ ਤਰਕ ਦੇ ਫੰਦੇ ਵਿੱਚ ਫਸ ਜਾਂਦੇ ਹਨ।
- ਨਿਰੀਖਣਸ਼ੀਲ ਸਖ਼ਤੀ ਦੀ ਲੋੜ: AI ਭਾਈਚਾਰੇ ਨੂੰ ਮਾਡਲਾਂ ਨੂੰ ਉੱਚ ਸੋਚਣ ਪ੍ਰਕਿਰਿਆਵਾਂ ਦੇਣ ਦੀ ਬਜਾਏ ਸਖ਼ਤ ਤਰੀਕੇ ਨਾਲ ਨਿਰੀਖਣਯੋਗ, ਪਰੀਖਣਯੋਗ ਗਣਨਾਤਮਕ ਆਊਟਪੁੱਟ 'ਤੇ ਧਿਆਨ ਕੇਂਦਰਿਤ ਕਰਨ ਵੱਲ ਵਧਣਾ ਚਾਹੀਦਾ ਹੈ।