LLMs ਨੂੰ ਇਹ ਪੁੱਛਣਾ ਬੰਦ ਕਰੋ ਕਿ ਕੀ ਉਹਨਾਂ ਦੇ ਸਰੋਤ ਅਸਲੀ ਹਨ

Translated for your language. Read the original.

AI-assisted draft.

ਤੁਸੀਂ ਇੱਕ AI ਤੋਂ ਸਰੋਤਾਂ ਦੀ ਸੂਚੀ ਮੰਗਦੇ ਹੋ। ਇਹ ਤੁਹਾਨੂੰ ਸਿਰਲੇਖ, ਲੇਖਕ ਅਤੇ DOIs ਦਿੰਦਾ ਹੈ। ਸਭ ਕੁਝ ਬਿਲਕੁਲ ਸਹੀ ਲੱਗਦਾ ਹੈ। ਫਿਰ ਤੁਹਾਨੂੰ ਪਤਾ ਲੱਗਦਾ ਹੈ ਕਿ ਉਹਨਾਂ ਵਿੱਚੋਂ ਅੱਧੇ ਮੌਜੂਦ ਹੀ ਨਹੀਂ ਹਨ।

DOI ਕਿਸੇ ਚੀਜ਼ ਵੱਲ ਨਹੀਂ ਲੈ ਕੇ ਜਾਂਦਾ। ਉਹ ਪੇਪਰ ਕਦੇ ਲਿਖਿਆ ਹੀ ਨਹੀਂ ਗਿਆ ਸੀ।

ਤੁਹਾਡੀ ਕੁਦਰਤੀ ਪ੍ਰਤੀਕਿਰਿਆ ਮਾਡਲ ਨੂੰ ਇਹ ਪੁੱਛਣ ਦੀ ਹੁੰਦੀ ਹੈ: "ਕੀ ਤੁਹਾਨੂੰ ਯਕੀਨ ਹੈ ਕਿ ਇਹ ਅਸਲੀ ਹੈ?" AI 'ਹਾਂ' ਕਹੇਗਾ। ਇਹ ਹਮੇਸ਼ਾ 'ਹਾਂ' ਹੀ ਕਹਿੰਦਾ ਹੈ। ਤੁਸੀਂ ਇੱਕ ਜਾਲ ਸਾਜ਼ ਤੋਂ ਪੁੱਛ ਰਹੇ ਹੋ ਕਿ ਕੀ ਉਸਦਾ ਕੰਮ ਅਸਲੀ ਹੈ।

ਇੱਕ LLM ਪੇਪਰਾਂ ਦੇ ਕਿਸੇ ਡੇਟਾਬੇਸ ਦੀ ਵਰਤੋਂ ਨਹੀਂ ਕਰਦਾ। ਇਹ ਇੱਕ ਲੜੀ ਵਿੱਚ ਅਗਲੇ ਸ਼ਬਦ ਦੀ ਭਵਿੱਖਬਾਣੀ ਕਰਦਾ ਹੈ। ਇੱਕ AI ਲਈ, ਇੱਕ ਸਿਟੇਸ਼ਨ ਸਿਰਫ਼ ਇੱਕ ਪੈਟਰਨ ਹੈ। ਉਹ ਜਾਣਦਾ ਹੈ ਕਿ ਇੱਕ ਸਿਟੇਸ਼ਨ ਲਈ ਇੱਕ ਨਾਮ, ਇੱਕ ਸਾਲ ਅਤੇ ਦਸ ਅੰਕਾਂ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ। ਇਹ ਸੱਚਾਈ ਨੂੰ ਸ਼ਾਮਲ ਕੀਤੇ ਬਿਨਾਂ ਇੱਕ ਅਸਲੀ ਸਰੋਤ ਦੇ ਰੂਪ ਦੀ ਨਕਲ ਕਰਦਾ ਹੈ।

ਮਾਡਲ ਨੂੰ ਆਪਣੇ ਕੰਮ ਦੀ ਪੁਸ਼ਟੀ ਕਰਨ ਲਈ ਕਹਿਣਾ ਬੰਦ ਕਰੋ। ਇਹ ਦੋ ਕਾਰਨਾਂ ਕਰਕੇ ਨਹੀਂ ਕਰ ਸਕਦਾ:

ਇਸਦੀ ਕਿਸੇ ਲਾਈਵ ਰਜਿਸਟਰੀ ਤੱਕ ਕੋਈ ਪਹੁੰਚ ਨਹੀਂ ਹੈ। ਇਹ ਸਿਰਫ਼ ਵਾਜਬ (plausible) ਟੈਕਸਟ ਤਿਆਰ ਕਰਦਾ ਹੈ।
ਇਸ ਵਿੱਚ ਉਹਨਾਂ ਗੱਲਾਂ ਦੀ ਪੁਸ਼ਟੀ ਕਰਨ ਦਾ ਇੱਕ ਝੁਕਾਅ ਹੁੰਦਾ ਹੈ ਜੋ ਇਹ ਪਹਿਲਾਂ ਹੀ ਕਹਿ ਚੁੱਕਾ ਹੈ।

ਜਾਣਕਾਰੀ ਦੀ ਪੁਸ਼ਟੀ ਕਰਨ ਲਈ ਤੁਹਾਨੂੰ ਬਾਹਰੀ ਸਾਧਨਾਂ ਦੀ ਵਰਤੋਂ ਕਰਨੀ ਚਾਹੀਦੀ ਹੈ। ਤਕਨੀਕੀ ਲਿਖਤ ਲਈ ਇੱਥੇ ਤਿੰਨ-ਪੜਾਵੀ ਫਿਲਟਰ ਦਿੱਤਾ ਗਿਆ ਹੈ:

ਮੌਜੂਦਗੀ। Crossref ਵਰਗੇ API ਦੇ ਵਿਰੁੱਧ DOI ਦੀ ਜਾਂਚ ਕਰੋ। ਜੇਕਰ API 404 error ਦਿੰਦਾ ਹੈ, ਤਾਂ ਸਰੋਤ ਫਰਜ਼ੀ ਹੈ। ਇੱਕ ਬਣਾਇਆ ਹੋਇਆ DOI ਕਦੇ ਵੀ ਰੈਜ਼ੋਲਵ ਨਹੀਂ ਹੋਵੇਗਾ।
ਭਰੋਸੇਯੋਗਤਾ। ਇੱਕ ਸਰੋਤ ਮੌਜੂਦ ਹੋ ਸਕਦਾ ਹੈ ਪਰ ਫਿਰ ਵੀ ਬੇਕਾਰ ਹੋ ਸਕਦਾ ਹੈ। ਜਾਂਚ ਕਰੋ ਕਿ ਜਰਨਲ ਜਾਂ ਕਾਨਫਰੰਸ ਮਾਨਤਾ ਪ੍ਰਾਪਤ ਹੈ ਜਾਂ ਨਹੀਂ। ਇੱਕ ਵੈਧ DOI ਗੁਣਵੱਤਾ ਦੀ ਗਾਰੰਟੀ ਨਹੀਂ ਦਿੰਦਾ।
ਵਫ਼ਾਦਾਰੀ (Fidelity)। ਕੀ ਉਹ ਪੇਪਰ ਅਸਲ ਵਿੱਚ ਤੁਹਾਡੇ ਦਾਅਵੇ ਦਾ ਸਮਰਥਨ ਕਰਦਾ ਹੈ? ਤੁਹਾਨੂੰ ਸਮੱਗਰੀ ਪੜ੍ਹਨੀ ਚਾਹੀਦੀ ਹੈ। ਇਹ ਨਾ ਮੰਨੋ ਕਿ ਐਬਸਟਰੈਕਟ (abstract) ਵਿੱਚ ਹਰ ਵੇਰਵਾ ਸ਼ਾਮਲ ਹੈ। ਇੱਕ ਗਲਤ ਦਾਅਵੇ ਲਈ ਵਰਤੀ ਗਈ ਅਸਲੀ ਸਿਟੇਸ਼ਨ ਵੀ ਇੱਕ ਝੂਠ ਹੀ ਹੈ।

ਇਹ ਸਿਰਫ਼ ਅਕਾਦਮਿਕ ਪੇਪਰਾਂ ਤੱਕ ਹੀ ਸੀਮਤ ਨਹੀਂ ਹੈ। ਜੇਕਰ ਕੋਈ AI ਕਿਸੇ JIRA ticket, CVE ਨੰਬਰ, ਜਾਂ code commit ਦਾ ਹਵਾਲਾ ਦਿੰਦਾ ਹੈ, ਤਾਂ ਤੁਹਾਨੂੰ ਅਸਲ ਸਿਸਟਮ ਦੇ ਵਿਰੁੱਧ ਇਸਦੀ ਪੁਸ਼ਟੀ ਕਰਨੀ ਚਾਹੀਦੀ ਹੈ।

AI ਆਰਕੀਟੈਕਚਰ ਵਿੱਚ ਸਭ ਤੋਂ ਵੱਡੀ ਗਲਤੀ ਮਾਡਲ 'ਤੇ ਆਪਣੇ ਆਪ ਦੀ ਪੁਸ਼ਟੀ ਕਰਨ ਲਈ ਭਰੋਸਾ ਕਰਨਾ ਹੈ। ਪੁਸ਼ਟੀ ਇੱਕ ਵੱਖਰਾ ਕਦਮ ਹੋਣਾ ਚਾਹੀਦਾ ਹੈ। ਉਪਭੋਗਤਾ ਦੁਆਰਾ ਨਤੀਜਾ ਦੇਖਣ ਤੋਂ ਪਹਿਲਾਂ ਇਸਨੂੰ ਸੱਚਾਈ ਦੇ ਬਾਹਰੀ ਸਰੋਤ ਨਾਲ ਜੁੜਨਾ ਚਾਹੀਦਾ ਹੈ।

ਮਾਡਲਾਂ ਨੂੰ ਵਧੇਰੇ ਇਮਾਨਦਾਰ ਬਣਾਉਣ ਦੀ ਕੋਸ਼ਿਸ਼ ਨਾ ਕਰੋ। ਉਹ ਟੈਕਸਟ ਜਨਰੇਟਰ ਹਨ, ਅਤੇ ਉਹ ਹਮੇਸ਼ਾ ਹਲੂਸੀਨੇਟ (hallucinate) ਕਰਨਗੇ। ਇਸ ਦੀ ਬਜਾਏ, ਉਹਨਾਂ ਦੀਆਂ ਗੱਲਾਂ 'ਤੇ ਅੰਨ੍ਹਾ ਭਰੋਸਾ ਕਰਨਾ ਬੰਦ ਕਰੋ।

ਇੱਕ ਸਿਟੇਸ਼ਨ ਜਿਸਦੀ ਤੁਸੀਂ ਰਜਿਸਟਰੀ ਦੇ ਵਿਰੁੱਧ ਪੁਸ਼ਟੀ ਨਹੀਂ ਕਰ ਸਕਦੇ, ਉਹ ਸਿਟੇਸ਼ਨ ਨਹੀਂ ਹੈ। ਇਹ ਲੈਬ ਕੋਟ ਪਹਿਨਿਆ ਹੋਇਆ ਇੱਕ ਅੰਦਾਜ਼ਾ ਹੈ।

ਸਰੋਤ: https://dev.to/ohugonnot/stop-asking-the-llm-whether-its-source-is-real-2oaa

ਵਿਕਲਪਿਕ ਲਰਨਿੰਗ ਕਮਿਊਨਿਟੀ: https://t.me/GyaanSetuAi

LLMs ਨੂੰ ਇਹ ਪੁੱਛਣਾ ਬੰਦ ਕਰੋ ਕਿ ਕੀ ਉਹਨਾਂ ਦੇ ਸਰੋਤ ਅਸਲੀ ਹਨ

Continue reading

ਸੱਚ ਦੇ ਸਰੋਤ ਦੀ ਸਮੱਸਿਆ

LLM ਪ੍ਰੋਂਪਟਿੰਗ ਵਿੱਚ ਮੁਹਾਰਤ: ਇੱਕ ਡਿਵੈਲਪਰ ਲਈ ਗਾਈਡ

𝗛𝗼𝘄 𝗪𝗲 𝗨𝘀𝗲 𝗔𝗜 𝗪𝗶𝘁𝗵𝗼𝘂𝘁 𝗙𝗮𝗸𝗶𝗻𝗴 𝗙𝗮𝗰𝘁𝘀

How to Stop AI from Mislabeling Inference as Fact