Why LLMs Struggle to Mimic Human Diversity in Arguments

Translated for your language. Read the original.

AI-assisted draft.

Why LLMs Struggle to Mimic Human Diversity in Arguments

In this article

ਤਰਕਾਂ ਵਿੱਚ ਮਨੁੱਖੀ ਵਿਭਿੰਨਤਾ ਦੀ ਨਕਲ ਕਰਨ ਵਿੱਚ LLMs ਕਿਉਂ ਸੰਘਰਸ਼ ਕਰਦੇ ਹਨ

ਜਿਵੇਂ-ਜਿਵੇਂ ਲਾਰਜ ਲੈਂਗੂਏਜ ਮਾਡਲ (LLMs) ਸਮੱਗਰੀ ਨਿਰਮਾਣ ਵਿੱਚ ਵਧੇਰੇ ਰਚਨਾਤਮਕ ਹੁੰਦੇ ਜਾ ਰਹੇ ਹਨ, ਇੱਕ ਮਹੱਤਵਪੂਰਨ ਸਵਾਲ ਉੱਭਰਦਾ ਹੈ: ਕੀ ਅਸੀਂ ਮਸ਼ੀਨ ਦੁਆਰਾ ਤਿਆਰ ਕੀਤੇ ਗਏ ਟੈਕਸਟ ਨੂੰ ਮਨੁੱਖੀ ਲਿਖਤ ਤੋਂ ਸੱਚਮੁੱਚ ਵੱਖਰਾ ਕਰ ਸਕਦੇ ਹਾਂ? AI ਟੈਕਸਟ ਡਿਟੈਕਸ਼ਨ ਸਟਾਰਟਅੱਪ Pangram ਦੇ CEO, Max Spero ਦਾ ਸੁਝਾਅ ਹੈ ਕਿ ਇਸਦਾ ਜਵਾਬ ਵਿਆਕਰਣ ਵਿੱਚ ਨਹੀਂ, ਸਗੋਂ AI ਮਾਡਲਾਂ ਦੇ ਅੰਦਰ ਮੌਜੂਦ ਬੌਧਿਕ ਵਿਭਿੰਨਤਾ ਦੀ ਘਾਟ ਵਿੱਚ ਹੈ।

AI ਤਰਕ ਵਿੱਚ "ਇੱਕਸਾਰਤਾ ਦੀ ਸਮੱਸਿਆ"

ਮੌਜੂਦਾ LLMs ਵਿੱਚ ਸਭ ਤੋਂ ਵੱਡੀਆਂ ਖਾਮੀਆਂ ਵਿੱਚੋਂ ਇੱਕ ਅੰਕੜਾਤਮਕ ਕਲੱਸਟਰਿੰਗ (statistical clustering) ਵੱਲ ਉਹਨਾਂ ਦਾ ਰੁਝਾਨ ਹੈ। ਹਾਲਾਂਕਿ ਇੱਕ AI ਸੰਪੂਰਨ ਵਿਆਕਰਣ ਅਤੇ ਰਸਮੀ ਤਰਕ ਦੇ ਮਾਮਲੇ ਵਿੱਚ ਇੱਕ ਆਮ ਮਨੁੱਖ ਨਾਲੋਂ ਬਿਹਤਰ ਪ੍ਰਦਰਸ਼ਨ ਕਰ ਸਕਦਾ ਹੈ, ਪਰ ਇਸ ਵਿੱਚ ਉਸ "ਤਰਕਸ਼ੀਲ ਵਿਸ਼ਾਲਤਾ" (argumentative breadth) ਦੀ ਘਾਟ ਹੈ ਜੋ ਮਨੁੱਖੀ ਬੁੱਧੀ ਨੂੰ ਪਰਿਭਾਸ਼ਿਤ ਕਰਦੀ ਹੈ। Spero ਦੇ ਅਨੁਸਾਰ, ਜੇਕਰ ਤੁਸੀਂ ਕਿਸੇ ਇੱਕ ਵਿਸ਼ੇ 'ਤੇ LLM ਤੋਂ 100 ਵੱਖ-ਵੱਖ ਤਰਕ ਮੰਗਦੇ ਹੋ, ਤਾਂ ਉਹਨਾਂ ਦੇ ਨਤੀਜੇ ਲਾਜ਼ਮੀ ਤੌਰ 'ਤੇ ਇੱਕ ਤੰਗ ਅਤੇ ਅਨੁਮਾਨਿਤ ਸੀਮਾ ਦੇ ਅੰਦਰ ਹੀ ਰਹਿਣਗੇ।

ਇਸਦੇ ਉਲਟ, ਮਨੁੱਖੀ ਵਿਚਾਰਾਂ ਦਾ ਖੇਤਰ ਬਹੁਤ ਵਿਸ਼ਾਲ ਅਤੇ ਗੁੰਝਲਦਾਰ ਹੈ। ਮਨੁੱਖ ਆਪਣੇ ਦ੍ਰਿਸ਼ਟੀਕੋਣ ਬਣਾਉਣ ਲਈ ਵਿਅਕਤੀਗਤ ਜੀਵਨ ਅਨੁਭਵਾਂ, ਸੱਭਿਆਚਾਰਕ ਸੂਖਮਤਾਵਾਂ ਅਤੇ ਗੈਰ-ਰਵਾਇਤੀ ਤਰਕਾਂ ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹਨ। LLMs, ਜੋ ਕਿ ਸਭ ਤੋਂ ਸੰਭਾਵੀ ਅਗਲੇ ਟੋਕਨ (token) ਦੀ ਭਵਿੱਖਬਾਣੀ ਕਰਨ ਲਈ ਸਿਖਲਾਈ ਪ੍ਰਾਪਤ ਹਨ, ਵੰਡ ਦੇ "ਕੇਂਦਰ" ਵੱਲ ਖਿੱਚੇ ਜਾਂਦੇ ਹਨ, ਜਿਸ ਦੇ ਨਤੀਜੇ ਵਜੋਂ ਤਰਕ ਦਾ ਇੱਕ ਦੁਹਰਾਉਣ ਵਾਲਾ ਪੈਟਰਨ ਬਣਦਾ ਹੈ ਜੋ ਉਹਨਾਂ ਦੇ ਬਣਾਵਟੀ ਸੁਭਾਅ ਨੂੰ ਉੱਨਤ ਕਲਾਸੀਫਾਇਰਾਂ (classifiers) ਲਈ ਪਛਾਣਨਾ ਆਸਾਨ ਬਣਾ ਦਿੰਦਾ ਹੈ।

Pangram ਮਸ਼ੀਨੀ ਪੈਟਰਨਾਂ ਦਾ ਪਤਾ ਕਿਵੇਂ ਲਗਾਉਂਦਾ ਹੈ

Pangram ਇੱਕ ਡੀਪ-ਲਰਨਿੰਗ ਕਲਾਸੀਫਾਇਰ ਦੀ ਵਰਤੋਂ ਕਰਦਾ ਹੈ ਜੋ ਇਹਨਾਂ ਸੂਖਮ ਸੰਰਚਨਾਤਮਕ ਨਿਸ਼ਾਨਾਂ ਦੀ ਪਛਾਣ ਕਰਨ ਲਈ ਤਿਆਰ ਕੀਤਾ ਗਿਆ ਹੈ। ਦਿਲਚਸਪ ਗੱਲ ਇਹ ਹੈ ਕਿ Spero Pangram ਦੀ ਆਪਣੀ ਤਕਨਾਲੋਜੀ ਨੂੰ ਇੱਕ "ਬਲੈਕ ਬਾਕਸ" ਵਜੋਂ ਦਰਸਾਉਂਦਾ ਹੈ, ਅਤੇ ਨੋਟ ਕਰਦਾ ਹੈ ਕਿ ਮਾਡਲ ਅਜਿਹੇ ਪੈਟਰਨਾਂ ਦੀ ਪਛਾਣ ਕਰਦਾ ਹੈ ਜਿਨ੍ਹਾਂ ਦੀ ਵਿਆਖਿਆ ਇਸਦੇ ਨਿਰਮਾਤਾ ਵੀ ਪੂਰੀ ਤਰ੍ਹਾਂ ਨਹੀਂ ਕਰ ਸਕਦੇ। ਹਾਲਾਂਕਿ ਇਹ ਟੂਲ ਸੰਕੇਤ ਵਜੋਂ ਕੁਝ ਖਾਸ ਸ਼ੱਕੀ ਵਾਕਾਂ ਨੂੰ ਸਾਹਮਣੇ ਲਿਆ ਸਕਦਾ ਹੈ, ਪਰ ਇਸਦੀ ਅਸਲ ਤਾਕਤ ਉਹ ਅੰਡਰਲਾਈਂਗ ਸੰਰਚਨਾਤਮਕ ਟੈਂਪਲੇਟਸ (structural templates) ਦਾ ਪਤਾ ਲਗਾਉਣ ਵਿੱਚ ਹੈ ਜੋ LLMs ਦਸਤਾਵੇਜ਼ ਨੂੰ ਸੰਗਠਿਤ ਕਰਦੇ ਸਮੇਂ ਛੱਡ ਜਾਂਦੇ ਹਨ।

ਇਹ ਟੈਂਪਲੇਟਸ ਸੰਭਾਵਨਾ ਦੇ ਡਿਜੀਟਲ ਫਿੰਗਰਪ੍ਰਿੰਟਸ ਹਨ। ਕਿਉਂਕਿ LLMs ਨੂੰ ਇਕਸਾਰਤਾ ਅਤੇ ਮਿਆਰੀ ਸੰਰਚਨਾ ਲਈ ਅਨੁਕੂਲ ਬਣਾਇਆ ਗਿਆ ਹੈ, ਉਹ ਸੰਗਠਨਾਤਮਕ ਮਾਰਗਾਂ ਦੀ ਪਾਲਣਾ ਕਰਦੇ ਹਨ ਜੋ ਇੱਕ ਮਨੁੱਖੀ ਲੇਖਕ ਲਈ ਅੰਕੜਾਤਮਕ ਤੌਰ 'ਤੇ ਅਸੰਭਵ ਹਨ, ਜੋ ਕਿ ਵਿਚਾਰਾਂ ਦੇ ਵਿਚਕਾਰ ਛਾਲ ਮਾਰ ਸਕਦਾ ਹੈ ਜਾਂ ਗੈਰ-ਰੇਖਿਕ ਤਬਦੀਲੀਆਂ (non-linear transitions) ਦੀ ਵਰਤੋਂ ਕਰ ਸਕਦਾ ਹੈ।

AI ਡਿਟੈਕਸ਼ਨ ਅਤੇ ਸਮੱਗਰੀ ਦੀ ਅਖੰਡਤਾ ਦਾ ਭਵਿੱਖ

ਇਹ ਵਿਕਾਸ AI ਦੇ ਖੇਤਰ ਵਿੱਚ ਵਧ ਰਹੀ ਹਥਿਆਰਾਂ ਦੀ ਦੌੜ (arms race) ਨੂੰ ਉਜਾਗਰ ਕਰਦਾ ਹੈ। ਜਿਵੇਂ-ਜਿਵੇਂ ਜਨਰੇਟਿਵ ਮਾਡਲ ਵਧੇਰੇ ਉੱਨਤ ਹੁੰਦੇ ਜਾ ਰਹੇ ਹਨ, ਸਧਾਰਨ ਪੈਟਰਨ ਮੈਚਿੰਗ ਹੁਣ ਕਾਫ਼ੀ ਨਹੀਂ ਹੋਵੇਗੀ। Pangram ਵਰਗੇ ਉੱਨਤ ਡਿਟੈਕਟਰਾਂ ਨੂੰ ਸੱਚਮੁੱਚ "ਧੋਖਾ" ਦੇਣ ਲਈ, ਡਿਵੈਲਪਰਾਂ ਨੂੰ ਸੰਭਾਵਨਾਤਮਕ ਟੈਕਸਟ ਜਨਰੇਸ਼ਨ ਤੋਂ ਅੱਗੇ ਵਧ ਕੇ ਅਸਲ ਤਰਕਸ਼ੀਲ ਵਿਭਿੰਨਤਾ ਵਾਲੇ ਮਾਡਲਾਂ ਵੱਲ ਵਧਣ ਦੀ ਲੋੜ ਹੋਵੇਗੀ।

ਜਨਰੇਟਿਵ ਖੇਤਰ ਵਿੱਚ ਕੰਮ ਕਰਨ ਵਾਲੇ ਸੰਸਥਾਪਕਾਂ ਅਤੇ ਡਿਵੈਲਪਰਾਂ ਲਈ, ਇਹ ਇੱਕ ਤਕਨੀਕੀ ਚੇਤਾਵਨੀ ਵਜੋਂ ਕੰਮ ਕਰਦਾ ਹੈ: "ਮਨੁੱਖੀ-ਪੱਧਰ" ਦੇ AI ਦੇ ਮਾਰਗ ਲਈ ਸਿਰਫ਼ ਬਿਹਤਰ ਵਿਆਕਰਣ ਹੀ ਕਾਫ਼ੀ ਨਹੀਂ ਹੈ; ਇਸ ਲਈ ਅਨੁਮਾਨਿਤ ਔਸਤ ਤੋਂ ਦੂਰ ਜਾਣ ਅਤੇ ਮਨੁੱਖੀ ਵਿਚਾਰਾਂ ਦੀ ਅਨਿਯੰਤ ਵਿਭਿੰਨਤਾ ਨੂੰ ਅਪਣਾਉਣ ਦੀ ਯੋਗਤਾ ਦੀ ਲੋੜ ਹੈ।

ਮੁੱਖ ਨੁਕਤੇ

ਅੰਕੜਾਤਮਕ ਕਲੱਸਟਰਿੰਗ (Statistical Clustering): LLMs ਅਜਿਹੇ ਤਰਕ ਪੈਦਾ ਕਰਨ ਦੀ ਪ੍ਰਵਿਰਤੀ ਰੱਖਦੇ ਹਨ ਜੋ ਇੱਕ ਤੰਗ ਸੀਮਾ ਦੇ ਅੰਦਰ ਹੁੰਦੇ ਹਨ, ਜਦੋਂ ਕਿ ਮਨੁੱਖੀ ਤਰਕ ਉੱਚ ਵਿਭਿੰਨਤਾ ਅਤੇ ਅਨਿਯੰਤਤਾ ਦੁਆਰਾ ਵਿਸ਼ੇਸ਼ਤਾ ਰੱਖਦਾ ਹੈ।
ਸੰਰਚਨਾਤਮਕ ਫਿੰਗਰਪ੍ਰਿੰਟਸ (Structural Fingerprints): Pangram ਵਰਗੇ AI ਟੈਕਸਟ ਡਿਟੈਕਟਰ ਸੰਭਾਵਨਾਤਮਕ ਮਾਡਲਾਂ ਦੁਆਰਾ ਛੱਡੇ ਗਏ ਡੂੰਘੇ ਸੰਰਚਨਾਤਮਕ ਪੈਟਰਨਾਂ ਅਤੇ ਸੰਗਠਨਾਤਮਕ ਟੈਂਪਲੇਟਸ ਦੀ ਪਛਾਣ ਕਰਕੇ ਮਸ਼ੀਨ ਦੁਆਰਾ ਤਿਆਰ ਕੀਤੀ ਗਈ ਸਮੱਗਰੀ ਦੀ ਪਛਾਣ ਕਰਦੇ ਹਨ।
ਤਰਕ ਦਾ ਪਾੜਾ (The Logic Gap): ਹਾਲਾਂਕਿ LLMs ਰਸਮੀ ਤਰਕ ਅਤੇ ਵਿਆਕਰਣ ਵਿੱਚ ਉੱਤਮ ਹੋ ਸਕਦੇ ਹਨ, ਪਰ ਉਹਨਾਂ ਵਿੱਚ ਬੌਧਿਕ ਵਿਭਿੰਨਤਾ ਦੀ ਘਾਟ ਉਹਨਾਂ ਨੂੰ ਉਹਨਾਂ ਦੀ ਅੰਦਰੂਨੀ ਇੱਕਸਾਰਤਾ ਰਾਹੀਂ ਪਛਾਣੇ ਜਾਣ ਦੇ ਕਾਬਲ ਬਣਾਉਂਦੀ ਹੈ।

Why LLMs Struggle to Mimic Human Diversity in Arguments

ਤਰਕਾਂ ਵਿੱਚ ਮਨੁੱਖੀ ਵਿਭਿੰਨਤਾ ਦੀ ਨਕਲ ਕਰਨ ਵਿੱਚ LLMs ਕਿਉਂ ਸੰਘਰਸ਼ ਕਰਦੇ ਹਨ

AI ਤਰਕ ਵਿੱਚ "ਇੱਕਸਾਰਤਾ ਦੀ ਸਮੱਸਿਆ"

Pangram ਮਸ਼ੀਨੀ ਪੈਟਰਨਾਂ ਦਾ ਪਤਾ ਕਿਵੇਂ ਲਗਾਉਂਦਾ ਹੈ

AI ਡਿਟੈਕਸ਼ਨ ਅਤੇ ਸਮੱਗਰੀ ਦੀ ਅਖੰਡਤਾ ਦਾ ਭਵਿੱਖ

ਮੁੱਖ ਨੁਕਤੇ

Continue reading

ਪ੍ਰੀਸੀਜ਼ਨ ਇੰਜੀਨੀਅਰਿੰਗ ਰਾਹੀਂ LLM ਹਲੂਸੀਨੇਸ਼ਨਾਂ ਨਾਲ ਲੜਨ ਲਈ ਸ਼ਾਇਦ $9M ਇਕੱਠੇ ਕੀਤੇ

AI Detection Reliability Crisis: Some Tools Pass, Others Fail Completely

Breaking the AI Hivemind: How Flint is Combating LLM Groupthink

Breaking the LLM Groupthink: How Springboards is Redefining AI Creativity