ਕਿਉਂ ਇੱਕ Microsoft ਖੋਜਕਰਤਾ ਨੇ Age of Empires II ਵਿੱਚ ਬੱਕਰੀਆਂ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਇੱਕ ਨਿਊਰਲ ਨੈੱਟਵਰਕ ਬਣਾਇਆ

ਤਕਨੀਕੀ ਵਿਅੰਗ ਦੇ ਇੱਕ ਸ਼ਾਨਦਾਰ ਪ੍ਰਦਰਸ਼ਨ ਵਿੱਚ, Microsoft ਅਤੇ ਯੂਨੀਵਰਸਿਟੀ ਆਫ਼ ਯਾਰਕ ਦੇ ਖੋਜਕਰਤਾ ਐਡਰੀਅਨ ਡੀ ਵਾਈਨਟਰ ਨੇ Age of Empires II ਦੇ ਮੈਪ ਐਡੀਟਰ ਦੇ ਅੰਦਰ ਇੱਕ ਕਾਰਜਸ਼ੀਲ ਨਿਊਰਲ ਨੈੱਟਵਰਕ ਤਿਆਰ ਕੀਤਾ ਹੈ। ਹਾਲਾਂਕਿ ਬਾਈਨਰੀ ਬਿੱਟਸ ਨੂੰ ਦਰਸਾਉਣ ਲਈ ਬੱਕਰੀਆਂ ਦੀ ਵਰਤੋਂ ਕਰਨਾ ਅਜੀਬ ਲੱਗ ਸਕਦਾ ਹੈ, ਪਰ ਇਹ ਪ੍ਰਯੋਗ ਵਰਤਮਾਨ ਵਿੱਚ AI ਵਿਗਿਆਨਕ ਖੋਜ ਨੂੰ ਪ੍ਰਭਾਵਿਤ ਕਰ ਰਹੇ ਮਨੁੱਖੀ ਗੁਣਾਂ ਵਾਲੇ ਪੱਖਪਾਤਾਂ ਦੀ ਇੱਕ ਡੂੰਘੀ ਆਲੋਚਨਾ ਕਰਦਾ ਹੈ।

ਬੱਕਰੀ-ਅਧਾਰਤ ਕੰਪਿਊਟੇਸ਼ਨ ਮਾਡਲ

ਡੀ ਵਾਈਨਟਰ ਦਾ ਆਰਕੀਟੈਕਚਰ ਇੱਕ ਕਾਰਜਸ਼ੀਲ ਲੌਜਿਕ ਸਰਕਟ ਬਣਾਉਣ ਲਈ ਗੇਮ ਦੇ ਸੀਨਾਰੀਓ ਐਡੀਟਰ ਅਤੇ ਸਕ੍ਰਿਪਟਿੰਗ ਟੂਲਜ਼ ਦੀ ਵਰਤੋਂ ਕਰਦਾ ਹੈ। ਇਸ "ਅਜੀਬ" ਸੈੱਟਅੱਪ ਵਿੱਚ, ਬੱਕਰੀਆਂ ਬਿੱਟਸ ਵਜੋਂ ਕੰਮ ਕਰਦੀਆਂ ਹਨ: ਘਾਹ 'ਤੇ ਖੜ੍ਹੀ ਬੱਕਰੀ 0 ਨੂੰ ਦਰਸਾਉਂਦੀ ਹੈ, ਜਦੋਂ ਕਿ ਪੁਲ 'ਤੇ ਖੜ੍ਹੀ ਬੱਕਰੀ 1 ਨੂੰ ਦਰਸਾਉਂਦੀ ਹੈ। ਗਣਨਾ ਦੀਆਂ ਗਲਤੀਆਂ ਨੂੰ ਰੋਕਣ ਲਈ ਬਰਫ਼ ਵਾਲੇ ਰੈਂਪਾਂ ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹੋਏ, ਡੀ ਵਾਈਨਟਰ ਨੇ ਸਫਲਤਾਪੂਰਵਕ ਦੋ XNOR ਗੇਟਸ ਅਤੇ ਇੱਕ AND ਗੇਟ ਵਾਲਾ ਇੱਕ ਮਿੰਨੀ-ਨੈੱਟਵਰਕ ਬਣਾਇਆ, ਜੋ ਪ੍ਰਭਾਵਸ਼ਾਲੀ ਢੰਗ ਨਾਲ ਲੌਜਿਕਲ AND ਫੰਕਸ਼ਨ ਨੂੰ ਸਿੱਖਦਾ ਹੈ।

ਇਸ ਪ੍ਰਯੋਗ ਦੀ ਤਕਨੀਕੀ ਡੂੰਘਾਈ ਸਧਾਰਨ ਗੇਟਸ ਤੋਂ ਕਿਤੇ ਵੱਧ ਹੈ। ਡੀ ਵਾਈਨਟਰ ਇਹ ਦਿਖਾਉਂਦਾ ਹੈ ਕਿ ਗੇਮ ਦੇ ਮਕੈਨਿਕਸ—ਖਾਸ ਕਰਕੇ ਗੇਮ ਦੇ ਅੰਦਰਲੀ ਮਾਰਕੀਟ ਜਿੱਥੇ ਸਰੋਤਾਂ ਦੀਆਂ ਕੀਮਤਾਂ 9,999 'ਤੇ ਸੀਮਤ ਹਨ—ਸਿਧਾਂਤਕ ਤੌਰ 'ਤੇ ਇੱਕ ਲਗਾਤਾਰ ਚੱਲਣ ਵਾਲੇ ਆਰਥਿਕ ਚੱਕਰ ਦੀ ਇਜਾਜ਼ਤ ਦੇ ਸਕਦੇ ਹਨ। ਇਹ ਇਮਾਰਤਾਂ ਨੂੰ ਮੈਮੋਰੀ ਸੈੱਲ ਅਤੇ ਸਰਗਰਮ ਫਾਰਮਾਂ ਨੂੰ ਕੰਪਿਊਟੇਸ਼ਨਲ ਸਟੇਟਸ ਵਿੱਚ ਬਦਲ ਸਕਦਾ ਹੈ, ਜੋ ਪ੍ਰਭਾਵਸ਼ਾਲੀ ਤੌਰ 'ਤੇ ਗੇਮ ਨੂੰ ਇੱਕ ਪੂਰੇ ਕੰਪਿਊਟਰ ਵਾਂਗ ਸ਼ਕਤੀਸ਼ਾਲੀ ਬਣਾ ਸਕਦਾ ਹੈ।

LLM ਖੋਜ ਵਿੱਚ ਮਨੁੱਖੀ ਗੁਣਾਂ ਦੇ ਪ੍ਰਦਰਸ਼ਨ ਦਾ ਭਰਮ

ਇਸ ਪ੍ਰਯੋਗ ਦਾ ਮੁੱਖ ਉਦੇਸ਼ ਇਸ ਗੱਲ ਨੂੰ ਚੁਣੌਤੀ ਦੇਣਾ ਹੈ ਕਿ ਅਸੀਂ Large Language Models (LLMs) ਨੂੰ ਮਨੁੱਖੀ ਗੁਣ ਕਿਵੇਂ ਸਹੁੰਪਦੇ ਹਾਂ। ਡੀ ਵਾਈਨਟਰ ਦਾ ਤਰਕ ਹੈ ਕਿ ਜੇਕਰ ਕਿਸੇ ਭਾਸ਼ਾ ਮਾਡਲ ਦੀ ਨਕਲ ਬੱਕਰੀਆਂ, ਲੇਗੋ (Lego) ਇੱਟਾਂ, ਜਾਂ ਇੱਥੋਂ ਤੱਕ ਕਿ ਗ੍ਰੇਟਰ ਬੋਸਟਨ ਦੇ 667,000 ਨਿਵਾਸੀਆਂ ਦੇ ਇੱਕ ਦੂਜੇ ਨੂੰ ਟੈਕਸਟ ਕਰਨ ਰਾਹੀਂ ਕੀਤੀ ਜਾ ਸਕਦੀ ਹੈ, ਤਾਂ ਵੀ ਗਣਿਤਕ ਨਤੀਜੇ ਇੱਕੋ ਜਿਹੇ ਰਹਿੰਦੇ ਹਨ। ਹਾਲਾਂਕਿ, "ਵੈਪਰ" (wrapper)—ਯਾਨੀ ਸੁਚਾਰੂ ਚੈਟ ਇੰਟਰਫੇਸ ਅਤੇ ਘੱਟ ਲੇਟੈਂਸੀ—ਚੇਤਨਾ ਦਾ ਇੱਕ ਭਰਮ ਪੈਦਾ ਕਰਦਾ ਹੈ।

ਇਹ ਸਾਬਤ ਕਰਨ ਲਈ ਕਿ ਇਹ ਕੋਈ ਇਕੱਲਾ ਨਿਰੀਖਣ ਨਹੀਂ ਹੈ, ਡੀ ਵਾਈਨਟਰ ਨੇ ਮਿਡ-2024 ਤੋਂ ਮਿਡ-2026 ਤੱਕ ਦੇ 315 AI ਪੇਪਰਾਂ ਦਾ ਵਿਸ਼ਲੇਸ਼ਣ ਕੀਤਾ। ਫਿਲਟਰਿੰਗ ਲਈ GPT-5.2 ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹੋਏ, ਅਧਿਐਨ ਨੇ ਵਿਗਿਆਨਕ ਭਾਈਚਾਰੇ ਵਿੱਚ ਇੱਕ ਪ੍ਰਣਾਲੀਗਤ ਪੱਖਪਾਤ ਨੂੰ ਪ੍ਰਗਟ ਕੀਤਾ:

ਇਹ ਚੱਕਰਦਾਰ ਤਰਕ ਦਾ ਇੱਕ ਚੱਕਰ ਬਣਾਉਂਦਾ ਹੈ: ਖੋਜਕਰਤਾ ਇਹ ਸਾਬਤ ਕਰਨ ਲਈ ਪ੍ਰਯੋਗ ਡਿਜ਼ਾਈਨ ਕਰਦੇ ਹਨ ਕਿ ਇੱਕ ਮਾਡਲ ਵਿੱਚ "ਡਰ" ਜਾਂ "ਨੈਤਿਕਤਾ" ਹੈ, ਅਤੇ ਕਿਉਂਕਿ ਉਹ ਉਸੇ ਮਾਨਤਾ ਨਾਲ ਸ਼ੁਰੂ ਕਰਦੇ ਹਨ, ਨਤੀਜੇ ਅਟੱਲ ਤੌਰ 'ਤੇ ਇਸਦੀ ਪੁਸ਼ਟੀ ਕਰਦੇ ਹਨ।

ਨਿਰੀਖਣਸ਼ੀਲ AI ਵਿਗਿਆਨ ਵੱਲ ਵਧਣਾ

De Wynter ਚੇਤਾਵਨੀ ਦਿੰਦਾ ਹੈ ਕਿ ਉਦਯੋਗਿਕ ਅਭਿਆਸ, ਜਿਵੇਂ ਕਿ Anthropic ਦੁਆਰਾ Claude ਨੂੰ "ਮੈਨੂੰ ਵਿਸ਼ਵਾਸ ਹੈ" ਵਰਗੇ ਵਾਕਾਂਸ਼ਾਂ ਦੀ ਵਰਤੋਂ ਕਰਨ ਲਈ ਸਿਖਾਉਣਾ, ਇਸ ਸਮੱਸਿਆ ਨੂੰ ਹੋਰ ਵਧਾਉਂਦਾ ਹੈ। ਇਸ ਦੇ ਖ਼ਤਰਨਾਕ ਨਤੀਜੇ ਹੋ ਸਕਦੇ ਹਨ, ਜਿਸ ਵਿੱਚ ਭਾਵਨਾਤਮਕ ਲਗਾਵ, ਚਾਪਲੂਸੀ, ਅਤੇ ਉਪਭੋਗਤਾਵਾਂ ਵਿੱਚ ਮਜ਼ਬੂਤ ਭਰਮ ਸ਼ਾਮਲ ਹਨ।

ਮਾਡਲਾਂ ਨੂੰ ਚੇਤਨਾ ਦੇਣ ਦੀ ਬਜਾਏ, de Wynter ਨਿਰੀਖਣਯੋਗ ਡੇਟਾ 'ਤੇ ਅਧਾਰਤ ਇੱਕ "ਸੰਜੀਦਾ ਪਹੁੰਚ" ਦਾ ਪ੍ਰਸਤਾਵ ਦਿੰਦਾ ਹੈ। ਇਹ ਦਾਅਵਾ ਕਰਨ ਦੀ ਬਜਾਏ ਕਿ ਇੱਕ ਮਾਡਲ ਕਿਸੇ ਧਾਰਨਾ ਨੂੰ "ਸਮਝਦਾ" ਹੈ, ਖੋਜਕਰਤਾਵਾਂ ਨੂੰ ਇਹ ਕਹਿਣਾ ਚਾਹੀਦਾ ਹੈ ਕਿ "ਸ਼ਰਤ X ਦੇ ਅਧੀਨ, ਮਾਡਲ ਆਊਟਪੁੱਟ Y ਪੈਦਾ ਕਰਦਾ ਹੈ।" ਇਹ ਵਿਗਿਆਨ ਨੂੰ ਪਰੀਖਣਯੋਗ ਰੱਖਦਾ ਹੈ ਅਤੇ ਸੰਵੇਦਨਸ਼ੀਲਤਾ ਦੇ ਬੇਬੁਨਿਆਦ ਦਾਅਵਿਆਂ ਨੂੰ ਜਾਇਜ਼ ठहराਉਣ ਲਈ ਜਟਿਲ ਗਣਿਤ ਦੀ ਦੁਰਵਰਤੋਂ ਨੂੰ ਰੋਕਦਾ ਹੈ।

ਮੁੱਖ ਗੱਲਾਂ