ਤਰਕਾਂ ਵਿੱਚ ਮਨੁੱਖੀ ਵਿਭਿੰਨਤਾ ਦੀ ਨਕਲ ਕਰਨ ਵਿੱਚ LLMs ਕਿਉਂ ਸੰਘਰਸ਼ ਕਰਦੇ ਹਨ
ਜਿਵੇਂ-ਜਿਵੇਂ ਲਾਰਜ ਲੈਂਗੂਏਜ ਮਾਡਲ (LLMs) ਸਮੱਗਰੀ ਨਿਰਮਾਣ ਵਿੱਚ ਵਧੇਰੇ ਰਚਨਾਤਮਕ ਹੁੰਦੇ ਜਾ ਰਹੇ ਹਨ, ਇੱਕ ਮਹੱਤਵਪੂਰਨ ਸਵਾਲ ਉੱਭਰਦਾ ਹੈ: ਕੀ ਅਸੀਂ ਮਸ਼ੀਨ ਦੁਆਰਾ ਤਿਆਰ ਕੀਤੇ ਗਏ ਟੈਕਸਟ ਨੂੰ ਮਨੁੱਖੀ ਲਿਖਤ ਤੋਂ ਸੱਚਮੁੱਚ ਵੱਖਰਾ ਕਰ ਸਕਦੇ ਹਾਂ? AI ਟੈਕਸਟ ਡਿਟੈਕਸ਼ਨ ਸਟਾਰਟਅੱਪ Pangram ਦੇ CEO, Max Spero ਦਾ ਸੁਝਾਅ ਹੈ ਕਿ ਇਸਦਾ ਜਵਾਬ ਵਿਆਕਰਣ ਵਿੱਚ ਨਹੀਂ, ਸਗੋਂ AI ਮਾਡਲਾਂ ਦੇ ਅੰਦਰ ਮੌਜੂਦ ਬੌਧਿਕ ਵਿਭਿੰਨਤਾ ਦੀ ਘਾਟ ਵਿੱਚ ਹੈ।
AI ਤਰਕ ਵਿੱਚ "ਇੱਕਸਾਰਤਾ ਦੀ ਸਮੱਸਿਆ"
ਮੌਜੂਦਾ LLMs ਵਿੱਚ ਸਭ ਤੋਂ ਵੱਡੀਆਂ ਖਾਮੀਆਂ ਵਿੱਚੋਂ ਇੱਕ ਅੰਕੜਾਤਮਕ ਕਲੱਸਟਰਿੰਗ (statistical clustering) ਵੱਲ ਉਹਨਾਂ ਦਾ ਰੁਝਾਨ ਹੈ। ਹਾਲਾਂਕਿ ਇੱਕ AI ਸੰਪੂਰਨ ਵਿਆਕਰਣ ਅਤੇ ਰਸਮੀ ਤਰਕ ਦੇ ਮਾਮਲੇ ਵਿੱਚ ਇੱਕ ਆਮ ਮਨੁੱਖ ਨਾਲੋਂ ਬਿਹਤਰ ਪ੍ਰਦਰਸ਼ਨ ਕਰ ਸਕਦਾ ਹੈ, ਪਰ ਇਸ ਵਿੱਚ ਉਸ "ਤਰਕਸ਼ੀਲ ਵਿਸ਼ਾਲਤਾ" (argumentative breadth) ਦੀ ਘਾਟ ਹੈ ਜੋ ਮਨੁੱਖੀ ਬੁੱਧੀ ਨੂੰ ਪਰਿਭਾਸ਼ਿਤ ਕਰਦੀ ਹੈ। Spero ਦੇ ਅਨੁਸਾਰ, ਜੇਕਰ ਤੁਸੀਂ ਕਿਸੇ ਇੱਕ ਵਿਸ਼ੇ 'ਤੇ LLM ਤੋਂ 100 ਵੱਖ-ਵੱਖ ਤਰਕ ਮੰਗਦੇ ਹੋ, ਤਾਂ ਉਹਨਾਂ ਦੇ ਨਤੀਜੇ ਲਾਜ਼ਮੀ ਤੌਰ 'ਤੇ ਇੱਕ ਤੰਗ ਅਤੇ ਅਨੁਮਾਨਿਤ ਸੀਮਾ ਦੇ ਅੰਦਰ ਹੀ ਰਹਿਣਗੇ।
ਇਸਦੇ ਉਲਟ, ਮਨੁੱਖੀ ਵਿਚਾਰਾਂ ਦਾ ਖੇਤਰ ਬਹੁਤ ਵਿਸ਼ਾਲ ਅਤੇ ਗੁੰਝਲਦਾਰ ਹੈ। ਮਨੁੱਖ ਆਪਣੇ ਦ੍ਰਿਸ਼ਟੀਕੋਣ ਬਣਾਉਣ ਲਈ ਵਿਅਕਤੀਗਤ ਜੀਵਨ ਅਨੁਭਵਾਂ, ਸੱਭਿਆਚਾਰਕ ਸੂਖਮਤਾਵਾਂ ਅਤੇ ਗੈਰ-ਰਵਾਇਤੀ ਤਰਕਾਂ ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹਨ। LLMs, ਜੋ ਕਿ ਸਭ ਤੋਂ ਸੰਭਾਵੀ ਅਗਲੇ ਟੋਕਨ (token) ਦੀ ਭਵਿੱਖਬਾਣੀ ਕਰਨ ਲਈ ਸਿਖਲਾਈ ਪ੍ਰਾਪਤ ਹਨ, ਵੰਡ ਦੇ "ਕੇਂਦਰ" ਵੱਲ ਖਿੱਚੇ ਜਾਂਦੇ ਹਨ, ਜਿਸ ਦੇ ਨਤੀਜੇ ਵਜੋਂ ਤਰਕ ਦਾ ਇੱਕ ਦੁਹਰਾਉਣ ਵਾਲਾ ਪੈਟਰਨ ਬਣਦਾ ਹੈ ਜੋ ਉਹਨਾਂ ਦੇ ਬਣਾਵਟੀ ਸੁਭਾਅ ਨੂੰ ਉੱਨਤ ਕਲਾਸੀਫਾਇਰਾਂ (classifiers) ਲਈ ਪਛਾਣਨਾ ਆਸਾਨ ਬਣਾ ਦਿੰਦਾ ਹੈ।
Pangram ਮਸ਼ੀਨੀ ਪੈਟਰਨਾਂ ਦਾ ਪਤਾ ਕਿਵੇਂ ਲਗਾਉਂਦਾ ਹੈ
Pangram ਇੱਕ ਡੀਪ-ਲਰਨਿੰਗ ਕਲਾਸੀਫਾਇਰ ਦੀ ਵਰਤੋਂ ਕਰਦਾ ਹੈ ਜੋ ਇਹਨਾਂ ਸੂਖਮ ਸੰਰਚਨਾਤਮਕ ਨਿਸ਼ਾਨਾਂ ਦੀ ਪਛਾਣ ਕਰਨ ਲਈ ਤਿਆਰ ਕੀਤਾ ਗਿਆ ਹੈ। ਦਿਲਚਸਪ ਗੱਲ ਇਹ ਹੈ ਕਿ Spero Pangram ਦੀ ਆਪਣੀ ਤਕਨਾਲੋਜੀ ਨੂੰ ਇੱਕ "ਬਲੈਕ ਬਾਕਸ" ਵਜੋਂ ਦਰਸਾਉਂਦਾ ਹੈ, ਅਤੇ ਨੋਟ ਕਰਦਾ ਹੈ ਕਿ ਮਾਡਲ ਅਜਿਹੇ ਪੈਟਰਨਾਂ ਦੀ ਪਛਾਣ ਕਰਦਾ ਹੈ ਜਿਨ੍ਹਾਂ ਦੀ ਵਿਆਖਿਆ ਇਸਦੇ ਨਿਰਮਾਤਾ ਵੀ ਪੂਰੀ ਤਰ੍ਹਾਂ ਨਹੀਂ ਕਰ ਸਕਦੇ। ਹਾਲਾਂਕਿ ਇਹ ਟੂਲ ਸੰਕੇਤ ਵਜੋਂ ਕੁਝ ਖਾਸ ਸ਼ੱਕੀ ਵਾਕਾਂ ਨੂੰ ਸਾਹਮਣੇ ਲਿਆ ਸਕਦਾ ਹੈ, ਪਰ ਇਸਦੀ ਅਸਲ ਤਾਕਤ ਉਹ ਅੰਡਰਲਾਈਂਗ ਸੰਰਚਨਾਤਮਕ ਟੈਂਪਲੇਟਸ (structural templates) ਦਾ ਪਤਾ ਲਗਾਉਣ ਵਿੱਚ ਹੈ ਜੋ LLMs ਦਸਤਾਵੇਜ਼ ਨੂੰ ਸੰਗਠਿਤ ਕਰਦੇ ਸਮੇਂ ਛੱਡ ਜਾਂਦੇ ਹਨ।
ਇਹ ਟੈਂਪਲੇਟਸ ਸੰਭਾਵਨਾ ਦੇ ਡਿਜੀਟਲ ਫਿੰਗਰਪ੍ਰਿੰਟਸ ਹਨ। ਕਿਉਂਕਿ LLMs ਨੂੰ ਇਕਸਾਰਤਾ ਅਤੇ ਮਿਆਰੀ ਸੰਰਚਨਾ ਲਈ ਅਨੁਕੂਲ ਬਣਾਇਆ ਗਿਆ ਹੈ, ਉਹ ਸੰਗਠਨਾਤਮਕ ਮਾਰਗਾਂ ਦੀ ਪਾਲਣਾ ਕਰਦੇ ਹਨ ਜੋ ਇੱਕ ਮਨੁੱਖੀ ਲੇਖਕ ਲਈ ਅੰਕੜਾਤਮਕ ਤੌਰ 'ਤੇ ਅਸੰਭਵ ਹਨ, ਜੋ ਕਿ ਵਿਚਾਰਾਂ ਦੇ ਵਿਚਕਾਰ ਛਾਲ ਮਾਰ ਸਕਦਾ ਹੈ ਜਾਂ ਗੈਰ-ਰੇਖਿਕ ਤਬਦੀਲੀਆਂ (non-linear transitions) ਦੀ ਵਰਤੋਂ ਕਰ ਸਕਦਾ ਹੈ।
AI ਡਿਟੈਕਸ਼ਨ ਅਤੇ ਸਮੱਗਰੀ ਦੀ ਅਖੰਡਤਾ ਦਾ ਭਵਿੱਖ
ਇਹ ਵਿਕਾਸ AI ਦੇ ਖੇਤਰ ਵਿੱਚ ਵਧ ਰਹੀ ਹਥਿਆਰਾਂ ਦੀ ਦੌੜ (arms race) ਨੂੰ ਉਜਾਗਰ ਕਰਦਾ ਹੈ। ਜਿਵੇਂ-ਜਿਵੇਂ ਜਨਰੇਟਿਵ ਮਾਡਲ ਵਧੇਰੇ ਉੱਨਤ ਹੁੰਦੇ ਜਾ ਰਹੇ ਹਨ, ਸਧਾਰਨ ਪੈਟਰਨ ਮੈਚਿੰਗ ਹੁਣ ਕਾਫ਼ੀ ਨਹੀਂ ਹੋਵੇਗੀ। Pangram ਵਰਗੇ ਉੱਨਤ ਡਿਟੈਕਟਰਾਂ ਨੂੰ ਸੱਚਮੁੱਚ "ਧੋਖਾ" ਦੇਣ ਲਈ, ਡਿਵੈਲਪਰਾਂ ਨੂੰ ਸੰਭਾਵਨਾਤਮਕ ਟੈਕਸਟ ਜਨਰੇਸ਼ਨ ਤੋਂ ਅੱਗੇ ਵਧ ਕੇ ਅਸਲ ਤਰਕਸ਼ੀਲ ਵਿਭਿੰਨਤਾ ਵਾਲੇ ਮਾਡਲਾਂ ਵੱਲ ਵਧਣ ਦੀ ਲੋੜ ਹੋਵੇਗੀ।
ਜਨਰੇਟਿਵ ਖੇਤਰ ਵਿੱਚ ਕੰਮ ਕਰਨ ਵਾਲੇ ਸੰਸਥਾਪਕਾਂ ਅਤੇ ਡਿਵੈਲਪਰਾਂ ਲਈ, ਇਹ ਇੱਕ ਤਕਨੀਕੀ ਚੇਤਾਵਨੀ ਵਜੋਂ ਕੰਮ ਕਰਦਾ ਹੈ: "ਮਨੁੱਖੀ-ਪੱਧਰ" ਦੇ AI ਦੇ ਮਾਰਗ ਲਈ ਸਿਰਫ਼ ਬਿਹਤਰ ਵਿਆਕਰਣ ਹੀ ਕਾਫ਼ੀ ਨਹੀਂ ਹੈ; ਇਸ ਲਈ ਅਨੁਮਾਨਿਤ ਔਸਤ ਤੋਂ ਦੂਰ ਜਾਣ ਅਤੇ ਮਨੁੱਖੀ ਵਿਚਾਰਾਂ ਦੀ ਅਨਿਯੰਤ ਵਿਭਿੰਨਤਾ ਨੂੰ ਅਪਣਾਉਣ ਦੀ ਯੋਗਤਾ ਦੀ ਲੋੜ ਹੈ।
ਮੁੱਖ ਨੁਕਤੇ
- ਅੰਕੜਾਤਮਕ ਕਲੱਸਟਰਿੰਗ (Statistical Clustering): LLMs ਅਜਿਹੇ ਤਰਕ ਪੈਦਾ ਕਰਨ ਦੀ ਪ੍ਰਵਿਰਤੀ ਰੱਖਦੇ ਹਨ ਜੋ ਇੱਕ ਤੰਗ ਸੀਮਾ ਦੇ ਅੰਦਰ ਹੁੰਦੇ ਹਨ, ਜਦੋਂ ਕਿ ਮਨੁੱਖੀ ਤਰਕ ਉੱਚ ਵਿਭਿੰਨਤਾ ਅਤੇ ਅਨਿਯੰਤਤਾ ਦੁਆਰਾ ਵਿਸ਼ੇਸ਼ਤਾ ਰੱਖਦਾ ਹੈ।
- ਸੰਰਚਨਾਤਮਕ ਫਿੰਗਰਪ੍ਰਿੰਟਸ (Structural Fingerprints): Pangram ਵਰਗੇ AI ਟੈਕਸਟ ਡਿਟੈਕਟਰ ਸੰਭਾਵਨਾਤਮਕ ਮਾਡਲਾਂ ਦੁਆਰਾ ਛੱਡੇ ਗਏ ਡੂੰਘੇ ਸੰਰਚਨਾਤਮਕ ਪੈਟਰਨਾਂ ਅਤੇ ਸੰਗਠਨਾਤਮਕ ਟੈਂਪਲੇਟਸ ਦੀ ਪਛਾਣ ਕਰਕੇ ਮਸ਼ੀਨ ਦੁਆਰਾ ਤਿਆਰ ਕੀਤੀ ਗਈ ਸਮੱਗਰੀ ਦੀ ਪਛਾਣ ਕਰਦੇ ਹਨ।
- ਤਰਕ ਦਾ ਪਾੜਾ (The Logic Gap): ਹਾਲਾਂਕਿ LLMs ਰਸਮੀ ਤਰਕ ਅਤੇ ਵਿਆਕਰਣ ਵਿੱਚ ਉੱਤਮ ਹੋ ਸਕਦੇ ਹਨ, ਪਰ ਉਹਨਾਂ ਵਿੱਚ ਬੌਧਿਕ ਵਿਭਿੰਨਤਾ ਦੀ ਘਾਟ ਉਹਨਾਂ ਨੂੰ ਉਹਨਾਂ ਦੀ ਅੰਦਰੂਨੀ ਇੱਕਸਾਰਤਾ ਰਾਹੀਂ ਪਛਾਣੇ ਜਾਣ ਦੇ ਕਾਬਲ ਬਣਾਉਂਦੀ ਹੈ।
