AI ਹਾਈਵਮਾਈਂਡ ਨੂੰ ਤੋੜਨਾ: Flint ਕਿਵੇਂ LLM ਗਰੁੱਪਥਿੰਕ (Groupthink) ਦਾ ਮੁਕਾਬਲਾ ਕਰ ਰਿਹਾ ਹੈ
ਜਦੋਂ ChatGPT ਅਤੇ Claude ਵਰਗੇ ਲਾਰਜ ਲੈਂਗੂਏਜ ਮਾਡਲ (LLMs) ਕੋਡਿੰਗ ਅਤੇ ਖੋਜ ਵਿੱਚ ਮਾਹਰ ਹਨ, ਉਹ ਲਗਾਤਾਰ ਇੱਕ ਅਨੁਮਾਨਿਤ "ਗਰੁੱਪਥਿੰਕ" (groupthink) ਦੇ ਜਾਲ ਵਿੱਚ ਫਸਦੇ ਜਾ ਰਹੇ ਹਨ। ਜਿਵੇਂ ਕਿ ਮੁੱਖਧਾਰਾ ਮਾਡਲ ਉੱਚ-ਸੰਭਾਵਨਾ ਵਾਲੇ, ਦੁਹਰਾਉਣਯੋਗ ਜਵਾਬਾਂ ਵੱਲ ਵਧ ਰਹੇ ਹਨ, ਇੱਕ ਨਵਾਂ ਸਟਾਰਟਅੱਪ ਜਨਰੇਟਿਵ AI ਈਕੋਸਿਸਟਮ ਵਿੱਚ ਬਹੁਤ ਲੋੜੀਂਦੀ ਵਿਭਿੰਨਤਾ (divergence) ਲਿਆਉਣ ਦੀ ਕੋਸ਼ਿਸ਼ ਕਰ ਰਿਹਾ ਹੈ।
ਸਮੱਸਿਆ: "ਆਰਟੀਫੀਸ਼ੀਅਲ ਹਾਈਵਮਾਈਂਡ" (Artificial Hivemind) ਪ੍ਰਭਾਵ
ਮੌਜੂਦਾ LLM ਵਿਕਾਸ ਵਿੱਚ ਇੱਕ ਵੱਡੀ ਸੀਮਾ ਇਹ ਹੈ ਕਿ ਮਾਡਲਾਂ ਦਾ ਰੁਝਾਨ ਸਭ ਤੋਂ ਵੱਧ ਅੰਕੜਾ ਵਿਗਿਆਨਕ ਤੌਰ 'ਤੇ ਸੰਭਾਵਿਤ ਜਵਾਬ ਵੱਲ ਹੁੰਦਾ ਹੈ, ਜਿਸ ਨਾਲ ਇੱਕ ਅਜਿਹੀ ਘਟਨਾ ਪੈਦਾ ਹੁੰਦੀ ਹੈ ਜਿਸ ਨੂੰ ਖੋਜਕਰਤਾ "ਆਰਟੀਫੀਸ਼ੀਅਲ ਹਾਈਵਮਾਈਂਡ" ਕਹਿੰਦੇ ਹਨ। NeurIPS ਐਵਾਰਡ ਜੇਤੂ ਇੱਕ ਪੇਪਰ, “Artificial Hivemind: The Open-Ended Homogeneity of Language Models (and Beyond),” ਨੇ ਇਸ ਡੂੰਘੀ ਜੜ੍ਹ ਵਾਲੀ ਦੁਹਰਾਅ ਨੂੰ ਉਜਾਗਰ ਕੀਤਾ ਹੈ।
ਖੋਜ ਟੀਮ ਨੇ 25 ਵੱਖ-ਵੱਖ LLMs ਦਾ ਟੈਸਟ ਕੀਤਾ, ਜਿਸ ਵਿੱਚ ਅਮਰੀਕਾ ਦੇ ਪ੍ਰਮੁੱਖ ਮਾਡਲ ਅਤੇ ਚੀਨ ਦੇ ਓਪਨ-ਸੋਰਸ ਵਰਜ਼ਨ ਸ਼ਾਮਲ ਸਨ। ਜਦੋਂ "ਸਮੇਂ" (time) ਲਈ ਇੱਕ ਰੂਪਕ (metaphor) ਮੰਗਿਆ ਗਿਆ, ਤਾਂ 1,250 ਜਵਾਬਾਂ ਵਿੱਚੋਂ ਬਹੁਤ ਵੱਡੀ ਗਿਣਤੀ "ਸਮਾਂ ਇੱਕ ਨਦੀ ਹੈ" ਜਾਂ "ਸਮਾਂ ਇੱਕ ਬੁਣਕਰ ਹੈ" ਵਰਗੇ ਕਲਿਸ਼ੇ (clichés) ਵੱਲ ਵਧ ਗਈ। ਵਿਭਿੰਨਤਾ ਦੀ ਇਹ ਕਮੀ ਸਿਰਫ਼ ਇੱਕ ਅਜੀਬ ਗੱਲ ਨਹੀਂ ਹੈ; ਇਹ ਭਰੋਸੇਯੋਗਤਾ ਅਤੇ ਇਕਸਾਰਤਾ ਨੂੰ ਵੱਧ ਤੋਂ ਵੱਧ ਕਰਨ ਦੇ ਮੁੱਖ ਉਦੇਸ਼ ਨਾਲ ਸਮਾਨ ਡੇਟਾਸੈਟਾਂ 'ਤੇ ਮਾਡਲਾਂ ਨੂੰ ਟ੍ਰੇਨ ਕਰਨ ਦਾ ਇੱਕ ਉਪ-ਉਤਪਾਦ (byproduct) ਹੈ। OpenAI ਨੇ ਮੰਨਿਆ ਹੈ ਕਿ ਨਵੀਨਤਾ (novelty) ਲਈ ਜ਼ੋਰ ਦੇਣ ਨਾਲ ਕਦੇ-ਕਦੇ ਕਮਜ਼ੋਰ ਅਤੇ ਘੱਟ ਭਰੋਸੇਯੋਗ ਜਵਾਬ ਮਿਲ ਸਕਦੇ ਹਨ, ਇਸੇ ਲਈ ਜ਼ਿਆਦਾਤਰ ਮਾਡਲ ਸੁਰੱਖਿਅਤ, "ਉੱਚ-ਸੰਭਾਵਨਾ" ਵਾਲੇ ਆਉਟਪੁੱਟ ਨੂੰ ਹੀ ਚੁਣਦੇ ਹਨ।
Flint ਦਾ ਆਗਮਨ: ਅਨੁਮਾਨਯੋਗਤਾ ਦੀ ਬਜਾਏ ਵਿਭਿੰਨਤਾ ਨੂੰ ਤਰਜੀਹ ਦੇਣਾ
ਆਸਟ੍ਰੇਲੀਅਨ ਸਟਾਰਟਅੱਪ Springboards ਆਪਣੇ ਨਵੇਂ ਮਾਡਲ, Flint ਨਾਲ ਇਸ ਸਥਿਤੀ ਨੂੰ ਚੁਣੌਤੀ ਦੇ ਰਿਹਾ ਹੈ। ਮੁੱਖਧਾਰਾ ਮਾਡਲਾਂ ਦੇ ਉਲਟ, ਜੋ ਹਰ ਕੀਮਤ 'ਤੇ ਹਲੂਸੀਨੇਸ਼ਨ (hallucinations) ਨਾਲ ਲੜਦੇ ਹਨ, Springboards ਦੇ CEO Pip Bingemann ਦਾ ਕਹਿਣਾ ਹੈ ਕਿ ਰਚਨਾਤਮਕ ਕੰਮਾਂ ਲਈ ਇੱਕ ਹੱਦ ਤੱਕ ਅਨੁਮਾਨ ਨਾ ਲਗਾਈ ਜਾ ਸਕਣ ਵਾਲੀ ਵਿਭਿੰਨਤਾ (unpredictable divergence) ਜ਼ਰੂਰੀ ਹੈ।
ਵਿਵਹਾਰਕ ਟੈਸਟਿੰਗ ਵਿੱਚ, ਆਉਟਪੁੱਟ ਵੰਡ ਵਿੱਚ ਅੰਤਰ ਬਹੁਤ ਸਪਸ਼ਟ ਹੈ:
- ਯਦ੍ਰਿਛ (Randomness): ਜਦੋਂ ਇੱਕ ਰੈਂਡਮ ਨੰਬਰ ਮੰਗਿਆ ਗਿਆ, ਤਾਂ ChatGPT ਅਤੇ Claude ਅਕਸਰ "7" ਨੂੰ ਚੁਣਦੇ ਸਨ, ਜਦੋਂ ਕਿ Flint ਨੇ "3.7916" ਵਰਗੇ ਉੱਚ-ਸ਼ੁੱਧਤਾ ਵਾਲੇ, ਗੈਰ-ਮਿਆਰੀ ਨੰਬਰ ਦਿੱਤੇ।
- ਰਚਨਾਤਮਕ ਬ੍ਰਾਂਡਿੰਗ: ਜਦੋਂ New Balance ਲਈ ਟੈਗਲਾਈਨ ਮੰਗੀ ਗਈ, ਤਾਂ Claude ਅਤੇ ChatGPT ਦੋਵਾਂ ਨੇ "Run your way" ਦਿੱਤਾ, ਜਦੋਂ ਕਿ Flint ਨੇ ਇੱਕ ਵੱਖਰਾ ਵਿਕਲਪ ਪੇਸ਼ ਕੀਤਾ: "Built to last, run to win."
- ਨਾਮ ਦੀ ਚੋਣ (Noun Selection): ਜਿੱਥੇ ਮੁੱਖਧਾਰਾ ਮਾਡਲ Toyota ਜਾਂ Honda ਵਰਗੇ "ਸੁਰੱਖਿਅਤ" ਬ੍ਰਾਂਡਾਂ ਵੱਲ ਝੁਕਦੇ ਹਨ, Flint ਇੱਕ ਵਿਸ਼ਾਲ ਰੇਂਜ ਦਿਖਾਉਂਦਾ ਹੈ, ਜਿਸ ਵਿੱਚ Ford F-150 ਵਰਗੇ ਘੱਟ ਅਨੁਮਾਨਿਤ ਵਿਕਲਪਾਂ ਦੀ ਚੋਣ ਕੀਤੀ ਜਾਂਦੀ ਹੈ।
ਪੇਸ਼ੇਵਰਾਂ ਲਈ ਇੱਕ ਰਚਨਾਤਮਕ ਸਾਧਨ
Springboards ਸਿਰਫ਼ ਇੱਕ ਸਟੈਂਡਅਲੋਨ ਮਾਡਲ ਹੀ ਨਹੀਂ ਬਣਾ ਰਿਹਾ; ਉਹ ਵਿਗਿਆਪਨ ਅਤੇ ਮਾਰਕੀਟਿੰਗ ਪੇਸ਼ੇਵਰਾਂ ਲਈ ਇੱਕ ਵਿਸ਼ੇਸ਼ ਸਾਧਨ ਵਿਕਸਤ ਕਰ ਰਿਹਾ ਹੈ। ਇਹ ਪਲੇਟਫਾਰਮ ਉਪਭੋਗਤਾਵਾਂ ਨੂੰ ChatGPT ਅਤੇ Claude ਸਮੇਤ ਕਈ ਮਾਡਲਾਂ ਦੇ ਆਉਟਪੁੱਟ ਨੂੰ ਇਕੱਠਾ ਕਰਨ ਅਤੇ ਨਵੇਂ ਵਿਚਾਰਾਂ ਨੂੰ ਤਿਆਰ ਕਰਨ ਲਈ ਉਹਨਾਂ ਨੂੰ ਜੋੜਨ ਦੀ ਇਜਾਜ਼ਤ ਦਿੰਦਾ ਹੈ। Flint ਇਸ ਈਕੋਸਿਸਟਮ ਦੇ ਅੰਦਰ ਇੱਕ "ਰਚਨਾਤਮਕ ਕੈਟਾਪਲਟ" (creative catapult) ਵਜੋਂ ਕੰਮ ਕਰਦਾ ਹੈ, ਜੋ ਖਾਸ ਤੌਰ 'ਤੇ ਉਪਭੋਗਤਾਵਾਂ ਨੂੰ ਉਹਨਾਂ ਦੇ ਮੌਜੂਦਾ ਮਾਨਸਿਕ ਢਾਂਚੇ ਤੋਂ ਬਾਹਰ ਕੱਢਣ ਲਈ ਤਿਆਰ ਕੀਤਾ ਗਿਆ ਹੈ।
77X ਦੀ ਚੀਫ਼ ਸਟ੍ਰੈਟਜੀ ਅਫਸਰ Zoe Scaman ਨੇ ਨੋਟ ਕੀਤਾ ਕਿ ਜਦੋਂ ਕਿ ਮੁੱਖਧਾਰਾ ਮਾਡਲ ਅਕਸਰ ਉਹੀ ਪੁਰਾਣੇ ਹੱਲ ਸੁਝਾਉਂਦੇ ਹਨ (ਜਿਵੇਂ ਕਿ "ਮਨੋਰੰਜਕ ਤਰੀਕੇ ਨਾਲ ਵਿੱਤੀ ਸਾਖਰਤਾ ਸਿਖਾਉਣਾ"), Flint ਦ੍ਰਿਸ਼ਟੀਕੋਣ ਵਿੱਚ ਕੱਟੜਮੋਲ ਤਬਦੀਲੀਆਂ ਪ੍ਰਦਾਨ ਕਰਦਾ ਹੈ, ਜਿਵੇਂ ਕਿ ਦੌਲਤ ਇਕੱਠੀ ਕਰਨ ਦੇ ਸੰਕਲਪ ਦੇ ਪੂਰੇ ਰੀਬ੍ਰਾਂਡਿੰਗ ਦਾ ਸੁਝਾਅ ਦੇਣਾ।
ਮੁੱਖ ਗੱਲਾਂ
- LLM ਸਮਾਨਤਾ (Homogeneity): ਸਮਾਨ ਸਿਖਲਾਈ ਵਿਧੀਆਂ ਕਾਰਨ ਪ੍ਰਮੁੱਖ ਮਾਡਲ ਸਮਾਨ, ਅਨੁਮਾਨਿਤ ਜਵਾਬਾਂ ਵੱਲ ਵਧ ਰਹੇ ਹਨ, ਜਿਸ ਨਾਲ "ਆਰਟੀਫੀਸ਼ੀਅਲ ਹਾਈਵਮਾਈਂਡ" ਪ੍ਰਭਾਵ ਪੈਦਾ ਹੋ ਰਿਹਾ ਹੈ।
- Flint ਦਾ ਪਹੁੰਚ (The Flint Approach): Springboards ਦਾ Flint ਮਾਡਲ ਜਵਾਬਾਂ ਦੀ ਵਿਭਿੰਨਤਾ ਅਤੇ ਵਿਭਿੰਨਤਾ ਨੂੰ ਤਰਜੀਹ ਦਿੰਦਾ ਹੈ, ਜੋ ਇਸਨੂੰ ਸਟੈਂਡਰਡ ਮਾਡਲਾਂ ਦੀ ਤੁਲਨਾ ਵਿੱਚ ਬ੍ਰੇਨਸਟਾਰਮਿੰਗ ਅਤੇ ਰਚਨਾਤਮਕ ਰਣਨੀਤੀ ਲਈ ਵਧੇਰੇ ਢੁਕਵਾਂ ਬਣਾਉਂਦਾ ਹੈ।
- ਭਰੋਸੇਯੋਗਤਾ ਦਾ ਸਮਝੌਤਾ (The Reliability Trade-off): ਉਦਯੋਗ ਨੂੰ ਮਾਡਲ ਦੀ ਭਰੋਸੇਯੋਗਤਾ (ਉੱਚ-ਸੰਭਾਵਨਾ ਦੀਆਂ ਸੀਮਾਵਾਂ ਦੇ ਅੰਦਰ ਰਹਿਣਾ) ਅਤੇ ਰਚਨਾਤਮਕ ਨਵੀਨਤਾ (ਘੱਟ-ਸੰਭਾਵਨਾ ਵਾਲੇ, ਵਿਭਿੰਨ ਆਉਟਪੁੱਟ ਨੂੰ ਅਪਣਾਉਣਾ) ਦੇ ਵਿਚਕਾਰ ਇੱਕ ਮੂਲ ਤਣਾਅ ਦਾ ਸਾਹਮਣਾ ਕਰਨਾ ਪੈ ਰਿਹਾ ਹੈ।
