Stop Asking LLMs If Their Sources Are Real

Translated for your language. Read the original.

AI-assisted draft.

GyaanSetu Editorial6 ದಿನಗಳ ಹಿಂದೆ2min read

Stop Asking LLMs If Their Sources Are Real

LLMಗಳ ಮೂಲಗಳು ನಿಜವೇ ಎಂದು ಕೇಳುವುದನ್ನು ನಿಲ್ಲಿಸಿ

ನೀವು AI ಗೆ ಮೂಲಗಳ ಪಟ್ಟಿಯನ್ನು ಕೇಳುತ್ತೀರಿ. ಅದು ನಿಮಗೆ ಶೀರ್ಷಿಕೆಗಳು, ಲೇಖಕರು ಮತ್ತು DOIs ನೀಡುತ್ತದೆ. ಎಲ್ಲವೂ ಪರಿಪೂರ್ಣವಾಗಿ ಕಾಣುತ್ತದೆ. ನಂತರ ಅವುಗಳಲ್ಲಿ ಅರ್ಧವು ಅಸ್ತಿತ್ವದಲ್ಲಿಲ್ಲ ಎಂಬುದು ನಿಮಗೆ ತಿಳಿಯುತ್ತದೆ.

DOI ಯಾವುದನ್ನೂ ತೋರಿಸುವುದಿಲ್ಲ. ಆ ಪ್ರಬಂಧವನ್ನು ಎಂದಿಗೂ ಬರೆಯಲಾಗಿಲ್ಲ.

"ಇದು ನಿಜವೇ ಎಂದು ನಿಮಗೆ ಖಚಿತವಿದೆಯೇ?" ಎಂದು ಮಾಡೆಲ್ ಅನ್ನು ಕೇಳುವುದು ನಿಮ್ಮ ಸಹಜ ಪ್ರವೃತ್ತಿ. AI 'ಹೌದು' ಎಂದು ಹೇಳುತ್ತದೆ. ಅದು ಯಾವಾಗಲೂ 'ಹೌದು' ಎಂದೇ ಹೇಳುತ್ತದೆ. ನೀವು ಒಬ್ಬ ನಕಲಿ ತಯಾರಕನಿಗೆ ಅವನ ಕೆಲಸವು ನೈಜವೇ ಎಂದು ಕೇಳುತ್ತಿದ್ದೀರಿ ಎಂದರ್ಥ.

ಒಂದು LLM ಪ್ರಬಂಧಗಳ ಡೇಟಾಬೇಸ್ ಅನ್ನು ಬಳಸುವುದಿಲ್ಲ. ಅದು ಒಂದು ಸರಣಿಯಲ್ಲಿನ ಮುಂದಿನ ಪದವನ್ನು ಊಹಿಸುತ್ತದೆ. AI ಗೆ, ಉಲ್ಲೇಖವು (citation) ಕೇವಲ ಒಂದು ಮಾದರಿಯಾಗಿದೆ. ಉಲ್ಲೇಖಕ್ಕೆ ಒಂದು ಹೆಸರು, ಒಂದು ವರ್ಷ ಮತ್ತು ಹತ್ತು ಅಂಕಿಗಳು ಬೇಕೆಂದು ಅದಕ್ಕೆ ತಿಳಿದಿದೆ. ಅದು ಸತ್ಯವನ್ನು ಒಳಗೊಳ್ಳದೆ, ನಿಜವಾದ ಮೂಲದ ಆಕಾರವನ್ನು ಅನುಕರಿಸುತ್ತದೆ.

ಮಾಡೆಲ್ ತನ್ನ ಕೆಲಸವನ್ನು ತಾನೇ ಪರಿಶೀಲಿಸಲು ಕೇಳುವುದನ್ನು ನಿಲ್ಲಿಸಿ. ಅದಕ್ಕೆ ಎರಡು ಕಾರಣಗಳಿಂದ ಇದನ್ನು ಮಾಡಲು ಸಾಧ್ಯವಿಲ್ಲ:

ಅದಕ್ಕೆ ಲೈವ್ ರಿಜಿಸ್ಟ್ರಿಯ (live registry) ಪ್ರವೇಶವಿಲ್ಲ. ಅದು ಕೇವಲ ನಂಬಲರ್ಹವಾದ ಪಠ್ಯವನ್ನು ಸೃಷ್ಟಿಸುತ್ತದೆ.
ಅದು ಈಗಾಗಲೇ ಹೇಳಿದ್ದನ್ನು ದೃಢೀಕರಿಸುವ ಕಡೆಗೆ ಒಲವು ಹೊಂದಿದೆ.

ಮಾಹಿತಿಯನ್ನು ಪರಿಶೀಲಿಸಲು ನೀವು ಬಾಹ್ಯ ಸಾಧನಗಳನ್ನು ಬಳಸಲೇಬೇಕು. ತಾಂತ್ರಿಕ ಬರಹಕ್ಕಾಗಿ ಇಲ್ಲಿದೆ ಮೂರು ಹಂತದ ಫಿಲ್ಟರ್:

ಅಸ್ತಿತ್ವ (Existence). Crossref ನಂತಹ API ಮೂಲಕ DOI ಅನ್ನು ಪರಿಶೀಲಿಸಿ. ಒಂದು ವೇಳೆ API 404 error ನೀಡಿದರೆ, ಆ ಮೂಲವು ನಕಲಿ ಎಂದರ್ಥ. ಕಲ್ಪಿತ DOI ಎಂದಿಗೂ ಕಾರ್ಯನಿರ್ವಹಿಸುವುದಿಲ್ಲ.
ವಿಶ್ವಾಸಾರ್ಹತೆ (Credibility). ಒಂದು ಮೂಲವು ಅಸ್ತಿತ್ವದಲ್ಲಿರಬಹುದು ಆದರೆ ಅದು ಪ್ರಯೋಜನವಿಲ್ಲದಿದ್ದರೂ ಆಗಬಹುದು. ಜರ್ನಲ್ ಅಥವಾ ಕಾನ್ಫರೆನ್ಸ್ ಅನ್ನು ಗುರುತಿಸಲಾಗಿದೆಯೇ ಎಂದು ಪರಿಶೀಲಿಸಿ. ಮಾನ್ಯವಾದ DOI ಗುಣಮಟ್ಟವನ್ನು ಖಾತರಿಪಡಿಸುವುದಿಲ್ಲ.
ನಿಖರತೆ (Fidelity). ಆ ಪ್ರಬಂಧವು ನಿಜವಾಗಿಯೂ ನಿಮ್ಮ ವಾದವನ್ನು ಬೆಂಬಲಿಸುತ್ತದೆಯೇ? ನೀವು ವಿಷಯವನ್ನು ಓದಲೇಬೇಕು. ಸಾರಾಂಶವು (abstract) ಪ್ರತಿಯೊಂದು ವಿವರವನ್ನು ಒಳಗೊಂಡಿದೆ ಎಂದು ಭಾವಿಸಬೇಡಿ. ಸುಳ್ಳು ವಾದಕ್ಕಾಗಿ ಬಳಸಲಾದ ನಿಜವಾದ ಉಲ್ಲೇಖವೂ ಸಹ ಸುಳ್ಳೇ ಆಗಿರುತ್ತದೆ.

ಇದು ಕೇವಲ ಶೈಕ್ಷಣಿಕ ಪ್ರಬಂಧಗಳಿಗೆ ಮಾತ್ರ ಅನ್ವಯಿಸುವುದಿಲ್ಲ. AI ಒಂದು JIRA ಟಿಕೆಟ್, CVE ಸಂಖ್ಯೆ ಅಥವಾ ಕೋಡ್ ಕಮಿಟ್ ಅನ್ನು ಉಲ್ಲೇಖಿಸಿದರೆ, ನೀವು ಅದನ್ನು ನಿಜವಾದ ವ್ಯವಸ್ಥೆಯೊಂದಿಗೆ ಪರಿಶೀಲಿಸಬೇಕು.

AI ಆರ್ಕಿಟೆಕ್ಚರ್‌ನಲ್ಲಿನ ದೊಡ್ಡ ತಪ್ಪು ಎಂದರೆ ಮಾಡೆಲ್ ತನ್ನನ್ನು ತಾನೇ ಪರಿಶೀಲಿಸುವುದನ್ನು ನಂಬುವುದು. ಪರಿಶೀಲನೆಯು ಒಂದು ಪ್ರತ್ಯೇಕ ಹಂತವಾಗಿರಬೇಕು. ಬಳಕೆದಾರರು ಫಲಿತಾಂಶವನ್ನು ನೋಡುವ ಮೊದಲು ಅದು ಬಾಹ್ಯ ಸತ್ಯದ ಮೂಲಕ್ಕೆ (external source of truth) ಸಂಪರ್ಕ ಹೊಂದಿರಬೇಕು.

ಮಾಡೆಲ್‌ಗಳನ್ನು ಹೆಚ್ಚು ಪ್ರಾಮಾಣಿಕವಾಗಿಸಲು ಪ್ರಯತ್ನಿಸಬೇಡಿ. ಅವು ಪಠ್ಯ ಜನರೇಟರ್‌ಗಳಾಗಿವೆ ಮತ್ತು ಅವು ಯಾವಾಗಲೂ ಭ್ರಮೆಗೊಳಿಸುತ್ತವೆ (hallucinate). ಬದಲಾಗಿ, ಅವು ಹೇಳಿದ್ದನ್ನು ಕುರುಡಾಗಿ ನಂಬುವುದನ್ನು ನಿಲ್ಲಿಸಿ.

ನೀವು ರಿಜಿಸ್ಟ್ರಿಯ ಮೂಲಕ ಪರಿಶೀಲಿಸಲು ಸಾಧ್ಯವಾಗದ ಉಲ್ಲೇಖವು ಉಲ್ಲೇಖವಲ್ಲ. ಅದು ಲ್ಯಾಬ್ ಕೋಟ್ ಧರಿಸಿದ ಕಲ್ಪಿತ ಊಹೆವಷ್ಟೇ.

ಮೂಲ: https://dev.to/ohugonnot/stop-asking-the-llm-whether-its-source-is-real-2oaa

ಐಚ್ಛಿಕ ಕಲಿಕಾ ಸಮುದಾಯ: https://t.me/GyaanSetuAi

Stop Asking LLMs If Their Sources Are Real

Continue reading

𝗧𝗵𝗲 𝗦𝗼𝘂𝗿𝗰𝗲 𝗼𝗳 𝗧𝗿𝘂𝘁𝗵 𝗣𝗿𝗼𝗯𝗹𝗲𝗺

LLM ಪ್ರಾಂಪ್ಟಿಂಗ್‌ನಲ್ಲಿ ಪರಿಣತಿ ಪಡೆಯುವುದು: ಒಬ್ಬ ಡೆವಲಪರ್‌ನ ಮಾರ್ಗದರ್ಶಿ

𝗛𝗼𝘄 𝗪𝗲 𝗨𝘀𝗲 𝗔𝗜 𝗪𝗶𝘁𝗵𝗼𝘂𝘁 𝗙𝗮𝗸𝗶𝗻𝗴 𝗙𝗮𝗰𝘁𝘀

How to Stop AI from Mislabeling Inference as Fact