LLMs ਨੂੰ ਇਹ ਪੁੱਛਣਾ ਬੰਦ ਕਰੋ ਕਿ ਕੀ ਉਹਨਾਂ ਦੇ ਸਰੋਤ ਅਸਲੀ ਹਨ

ਤੁਸੀਂ ਇੱਕ AI ਤੋਂ ਸਰੋਤਾਂ ਦੀ ਸੂਚੀ ਮੰਗਦੇ ਹੋ। ਇਹ ਤੁਹਾਨੂੰ ਸਿਰਲੇਖ, ਲੇਖਕ ਅਤੇ DOIs ਦਿੰਦਾ ਹੈ। ਸਭ ਕੁਝ ਬਿਲਕੁਲ ਸਹੀ ਲੱਗਦਾ ਹੈ। ਫਿਰ ਤੁਹਾਨੂੰ ਪਤਾ ਲੱਗਦਾ ਹੈ ਕਿ ਉਹਨਾਂ ਵਿੱਚੋਂ ਅੱਧੇ ਮੌਜੂਦ ਹੀ ਨਹੀਂ ਹਨ।

DOI ਕਿਸੇ ਚੀਜ਼ ਵੱਲ ਨਹੀਂ ਲੈ ਕੇ ਜਾਂਦਾ। ਉਹ ਪੇਪਰ ਕਦੇ ਲਿਖਿਆ ਹੀ ਨਹੀਂ ਗਿਆ ਸੀ।

ਤੁਹਾਡੀ ਕੁਦਰਤੀ ਪ੍ਰਤੀਕਿਰਿਆ ਮਾਡਲ ਨੂੰ ਇਹ ਪੁੱਛਣ ਦੀ ਹੁੰਦੀ ਹੈ: "ਕੀ ਤੁਹਾਨੂੰ ਯਕੀਨ ਹੈ ਕਿ ਇਹ ਅਸਲੀ ਹੈ?" AI 'ਹਾਂ' ਕਹੇਗਾ। ਇਹ ਹਮੇਸ਼ਾ 'ਹਾਂ' ਹੀ ਕਹਿੰਦਾ ਹੈ। ਤੁਸੀਂ ਇੱਕ ਜਾਲ ਸਾਜ਼ ਤੋਂ ਪੁੱਛ ਰਹੇ ਹੋ ਕਿ ਕੀ ਉਸਦਾ ਕੰਮ ਅਸਲੀ ਹੈ।

ਇੱਕ LLM ਪੇਪਰਾਂ ਦੇ ਕਿਸੇ ਡੇਟਾਬੇਸ ਦੀ ਵਰਤੋਂ ਨਹੀਂ ਕਰਦਾ। ਇਹ ਇੱਕ ਲੜੀ ਵਿੱਚ ਅਗਲੇ ਸ਼ਬਦ ਦੀ ਭਵਿੱਖਬਾਣੀ ਕਰਦਾ ਹੈ। ਇੱਕ AI ਲਈ, ਇੱਕ ਸਿਟੇਸ਼ਨ ਸਿਰਫ਼ ਇੱਕ ਪੈਟਰਨ ਹੈ। ਉਹ ਜਾਣਦਾ ਹੈ ਕਿ ਇੱਕ ਸਿਟੇਸ਼ਨ ਲਈ ਇੱਕ ਨਾਮ, ਇੱਕ ਸਾਲ ਅਤੇ ਦਸ ਅੰਕਾਂ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ। ਇਹ ਸੱਚਾਈ ਨੂੰ ਸ਼ਾਮਲ ਕੀਤੇ ਬਿਨਾਂ ਇੱਕ ਅਸਲੀ ਸਰੋਤ ਦੇ ਰੂਪ ਦੀ ਨਕਲ ਕਰਦਾ ਹੈ।

ਮਾਡਲ ਨੂੰ ਆਪਣੇ ਕੰਮ ਦੀ ਪੁਸ਼ਟੀ ਕਰਨ ਲਈ ਕਹਿਣਾ ਬੰਦ ਕਰੋ। ਇਹ ਦੋ ਕਾਰਨਾਂ ਕਰਕੇ ਨਹੀਂ ਕਰ ਸਕਦਾ:

  • ਇਸਦੀ ਕਿਸੇ ਲਾਈਵ ਰਜਿਸਟਰੀ ਤੱਕ ਕੋਈ ਪਹੁੰਚ ਨਹੀਂ ਹੈ। ਇਹ ਸਿਰਫ਼ ਵਾਜਬ (plausible) ਟੈਕਸਟ ਤਿਆਰ ਕਰਦਾ ਹੈ।
  • ਇਸ ਵਿੱਚ ਉਹਨਾਂ ਗੱਲਾਂ ਦੀ ਪੁਸ਼ਟੀ ਕਰਨ ਦਾ ਇੱਕ ਝੁਕਾਅ ਹੁੰਦਾ ਹੈ ਜੋ ਇਹ ਪਹਿਲਾਂ ਹੀ ਕਹਿ ਚੁੱਕਾ ਹੈ।

ਜਾਣਕਾਰੀ ਦੀ ਪੁਸ਼ਟੀ ਕਰਨ ਲਈ ਤੁਹਾਨੂੰ ਬਾਹਰੀ ਸਾਧਨਾਂ ਦੀ ਵਰਤੋਂ ਕਰਨੀ ਚਾਹੀਦੀ ਹੈ। ਤਕਨੀਕੀ ਲਿਖਤ ਲਈ ਇੱਥੇ ਤਿੰਨ-ਪੜਾਵੀ ਫਿਲਟਰ ਦਿੱਤਾ ਗਿਆ ਹੈ:

  1. ਮੌਜੂਦਗੀ। Crossref ਵਰਗੇ API ਦੇ ਵਿਰੁੱਧ DOI ਦੀ ਜਾਂਚ ਕਰੋ। ਜੇਕਰ API 404 error ਦਿੰਦਾ ਹੈ, ਤਾਂ ਸਰੋਤ ਫਰਜ਼ੀ ਹੈ। ਇੱਕ ਬਣਾਇਆ ਹੋਇਆ DOI ਕਦੇ ਵੀ ਰੈਜ਼ੋਲਵ ਨਹੀਂ ਹੋਵੇਗਾ।

  2. ਭਰੋਸੇਯੋਗਤਾ। ਇੱਕ ਸਰੋਤ ਮੌਜੂਦ ਹੋ ਸਕਦਾ ਹੈ ਪਰ ਫਿਰ ਵੀ ਬੇਕਾਰ ਹੋ ਸਕਦਾ ਹੈ। ਜਾਂਚ ਕਰੋ ਕਿ ਜਰਨਲ ਜਾਂ ਕਾਨਫਰੰਸ ਮਾਨਤਾ ਪ੍ਰਾਪਤ ਹੈ ਜਾਂ ਨਹੀਂ। ਇੱਕ ਵੈਧ DOI ਗੁਣਵੱਤਾ ਦੀ ਗਾਰੰਟੀ ਨਹੀਂ ਦਿੰਦਾ।

  3. ਵਫ਼ਾਦਾਰੀ (Fidelity)। ਕੀ ਉਹ ਪੇਪਰ ਅਸਲ ਵਿੱਚ ਤੁਹਾਡੇ ਦਾਅਵੇ ਦਾ ਸਮਰਥਨ ਕਰਦਾ ਹੈ? ਤੁਹਾਨੂੰ ਸਮੱਗਰੀ ਪੜ੍ਹਨੀ ਚਾਹੀਦੀ ਹੈ। ਇਹ ਨਾ ਮੰਨੋ ਕਿ ਐਬਸਟਰੈਕਟ (abstract) ਵਿੱਚ ਹਰ ਵੇਰਵਾ ਸ਼ਾਮਲ ਹੈ। ਇੱਕ ਗਲਤ ਦਾਅਵੇ ਲਈ ਵਰਤੀ ਗਈ ਅਸਲੀ ਸਿਟੇਸ਼ਨ ਵੀ ਇੱਕ ਝੂਠ ਹੀ ਹੈ।

ਇਹ ਸਿਰਫ਼ ਅਕਾਦਮਿਕ ਪੇਪਰਾਂ ਤੱਕ ਹੀ ਸੀਮਤ ਨਹੀਂ ਹੈ। ਜੇਕਰ ਕੋਈ AI ਕਿਸੇ JIRA ticket, CVE ਨੰਬਰ, ਜਾਂ code commit ਦਾ ਹਵਾਲਾ ਦਿੰਦਾ ਹੈ, ਤਾਂ ਤੁਹਾਨੂੰ ਅਸਲ ਸਿਸਟਮ ਦੇ ਵਿਰੁੱਧ ਇਸਦੀ ਪੁਸ਼ਟੀ ਕਰਨੀ ਚਾਹੀਦੀ ਹੈ।

AI ਆਰਕੀਟੈਕਚਰ ਵਿੱਚ ਸਭ ਤੋਂ ਵੱਡੀ ਗਲਤੀ ਮਾਡਲ 'ਤੇ ਆਪਣੇ ਆਪ ਦੀ ਪੁਸ਼ਟੀ ਕਰਨ ਲਈ ਭਰੋਸਾ ਕਰਨਾ ਹੈ। ਪੁਸ਼ਟੀ ਇੱਕ ਵੱਖਰਾ ਕਦਮ ਹੋਣਾ ਚਾਹੀਦਾ ਹੈ। ਉਪਭੋਗਤਾ ਦੁਆਰਾ ਨਤੀਜਾ ਦੇਖਣ ਤੋਂ ਪਹਿਲਾਂ ਇਸਨੂੰ ਸੱਚਾਈ ਦੇ ਬਾਹਰੀ ਸਰੋਤ ਨਾਲ ਜੁੜਨਾ ਚਾਹੀਦਾ ਹੈ।

ਮਾਡਲਾਂ ਨੂੰ ਵਧੇਰੇ ਇਮਾਨਦਾਰ ਬਣਾਉਣ ਦੀ ਕੋਸ਼ਿਸ਼ ਨਾ ਕਰੋ। ਉਹ ਟੈਕਸਟ ਜਨਰੇਟਰ ਹਨ, ਅਤੇ ਉਹ ਹਮੇਸ਼ਾ ਹਲੂਸੀਨੇਟ (hallucinate) ਕਰਨਗੇ। ਇਸ ਦੀ ਬਜਾਏ, ਉਹਨਾਂ ਦੀਆਂ ਗੱਲਾਂ 'ਤੇ ਅੰਨ੍ਹਾ ਭਰੋਸਾ ਕਰਨਾ ਬੰਦ ਕਰੋ।

ਇੱਕ ਸਿਟੇਸ਼ਨ ਜਿਸਦੀ ਤੁਸੀਂ ਰਜਿਸਟਰੀ ਦੇ ਵਿਰੁੱਧ ਪੁਸ਼ਟੀ ਨਹੀਂ ਕਰ ਸਕਦੇ, ਉਹ ਸਿਟੇਸ਼ਨ ਨਹੀਂ ਹੈ। ਇਹ ਲੈਬ ਕੋਟ ਪਹਿਨਿਆ ਹੋਇਆ ਇੱਕ ਅੰਦਾਜ਼ਾ ਹੈ।

ਸਰੋਤ: https://dev.to/ohugonnot/stop-asking-the-llm-whether-its-source-is-real-2oaa

ਵਿਕਲਪਿਕ ਲਰਨਿੰਗ ਕਮਿਊਨਿਟੀ: https://t.me/GyaanSetuAi