LLMಗಳ ಮೂಲಗಳು ನಿಜವೇ ಎಂದು ಕೇಳುವುದನ್ನು ನಿಲ್ಲಿಸಿ

ನೀವು AI ಗೆ ಮೂಲಗಳ ಪಟ್ಟಿಯನ್ನು ಕೇಳುತ್ತೀರಿ. ಅದು ನಿಮಗೆ ಶೀರ್ಷಿಕೆಗಳು, ಲೇಖಕರು ಮತ್ತು DOIs ನೀಡುತ್ತದೆ. ಎಲ್ಲವೂ ಪರಿಪೂರ್ಣವಾಗಿ ಕಾಣುತ್ತದೆ. ನಂತರ ಅವುಗಳಲ್ಲಿ ಅರ್ಧವು ಅಸ್ತಿತ್ವದಲ್ಲಿಲ್ಲ ಎಂಬುದು ನಿಮಗೆ ತಿಳಿಯುತ್ತದೆ.

DOI ಯಾವುದನ್ನೂ ತೋರಿಸುವುದಿಲ್ಲ. ಆ ಪ್ರಬಂಧವನ್ನು ಎಂದಿಗೂ ಬರೆಯಲಾಗಿಲ್ಲ.

"ಇದು ನಿಜವೇ ಎಂದು ನಿಮಗೆ ಖಚಿತವಿದೆಯೇ?" ಎಂದು ಮಾಡೆಲ್ ಅನ್ನು ಕೇಳುವುದು ನಿಮ್ಮ ಸಹಜ ಪ್ರವೃತ್ತಿ. AI 'ಹೌದು' ಎಂದು ಹೇಳುತ್ತದೆ. ಅದು ಯಾವಾಗಲೂ 'ಹೌದು' ಎಂದೇ ಹೇಳುತ್ತದೆ. ನೀವು ಒಬ್ಬ ನಕಲಿ ತಯಾರಕನಿಗೆ ಅವನ ಕೆಲಸವು ನೈಜವೇ ಎಂದು ಕೇಳುತ್ತಿದ್ದೀರಿ ಎಂದರ್ಥ.

ಒಂದು LLM ಪ್ರಬಂಧಗಳ ಡೇಟಾಬೇಸ್ ಅನ್ನು ಬಳಸುವುದಿಲ್ಲ. ಅದು ಒಂದು ಸರಣಿಯಲ್ಲಿನ ಮುಂದಿನ ಪದವನ್ನು ಊಹಿಸುತ್ತದೆ. AI ಗೆ, ಉಲ್ಲೇಖವು (citation) ಕೇವಲ ಒಂದು ಮಾದರಿಯಾಗಿದೆ. ಉಲ್ಲೇಖಕ್ಕೆ ಒಂದು ಹೆಸರು, ಒಂದು ವರ್ಷ ಮತ್ತು ಹತ್ತು ಅಂಕಿಗಳು ಬೇಕೆಂದು ಅದಕ್ಕೆ ತಿಳಿದಿದೆ. ಅದು ಸತ್ಯವನ್ನು ಒಳಗೊಳ್ಳದೆ, ನಿಜವಾದ ಮೂಲದ ಆಕಾರವನ್ನು ಅನುಕರಿಸುತ್ತದೆ.

ಮಾಡೆಲ್ ತನ್ನ ಕೆಲಸವನ್ನು ತಾನೇ ಪರಿಶೀಲಿಸಲು ಕೇಳುವುದನ್ನು ನಿಲ್ಲಿಸಿ. ಅದಕ್ಕೆ ಎರಡು ಕಾರಣಗಳಿಂದ ಇದನ್ನು ಮಾಡಲು ಸಾಧ್ಯವಿಲ್ಲ:

  • ಅದಕ್ಕೆ ಲೈವ್ ರಿಜಿಸ್ಟ್ರಿಯ (live registry) ಪ್ರವೇಶವಿಲ್ಲ. ಅದು ಕೇವಲ ನಂಬಲರ್ಹವಾದ ಪಠ್ಯವನ್ನು ಸೃಷ್ಟಿಸುತ್ತದೆ.
  • ಅದು ಈಗಾಗಲೇ ಹೇಳಿದ್ದನ್ನು ದೃಢೀಕರಿಸುವ ಕಡೆಗೆ ಒಲವು ಹೊಂದಿದೆ.

ಮಾಹಿತಿಯನ್ನು ಪರಿಶೀಲಿಸಲು ನೀವು ಬಾಹ್ಯ ಸಾಧನಗಳನ್ನು ಬಳಸಲೇಬೇಕು. ತಾಂತ್ರಿಕ ಬರಹಕ್ಕಾಗಿ ಇಲ್ಲಿದೆ ಮೂರು ಹಂತದ ಫಿಲ್ಟರ್:

  1. ಅಸ್ತಿತ್ವ (Existence). Crossref ನಂತಹ API ಮೂಲಕ DOI ಅನ್ನು ಪರಿಶೀಲಿಸಿ. ಒಂದು ವೇಳೆ API 404 error ನೀಡಿದರೆ, ಆ ಮೂಲವು ನಕಲಿ ಎಂದರ್ಥ. ಕಲ್ಪಿತ DOI ಎಂದಿಗೂ ಕಾರ್ಯನಿರ್ವಹಿಸುವುದಿಲ್ಲ.

  2. ವಿಶ್ವಾಸಾರ್ಹತೆ (Credibility). ಒಂದು ಮೂಲವು ಅಸ್ತಿತ್ವದಲ್ಲಿರಬಹುದು ಆದರೆ ಅದು ಪ್ರಯೋಜನವಿಲ್ಲದಿದ್ದರೂ ಆಗಬಹುದು. ಜರ್ನಲ್ ಅಥವಾ ಕಾನ್ಫರೆನ್ಸ್ ಅನ್ನು ಗುರುತಿಸಲಾಗಿದೆಯೇ ಎಂದು ಪರಿಶೀಲಿಸಿ. ಮಾನ್ಯವಾದ DOI ಗುಣಮಟ್ಟವನ್ನು ಖಾತರಿಪಡಿಸುವುದಿಲ್ಲ.

  3. ನಿಖರತೆ (Fidelity). ಆ ಪ್ರಬಂಧವು ನಿಜವಾಗಿಯೂ ನಿಮ್ಮ ವಾದವನ್ನು ಬೆಂಬಲಿಸುತ್ತದೆಯೇ? ನೀವು ವಿಷಯವನ್ನು ಓದಲೇಬೇಕು. ಸಾರಾಂಶವು (abstract) ಪ್ರತಿಯೊಂದು ವಿವರವನ್ನು ಒಳಗೊಂಡಿದೆ ಎಂದು ಭಾವಿಸಬೇಡಿ. ಸುಳ್ಳು ವಾದಕ್ಕಾಗಿ ಬಳಸಲಾದ ನಿಜವಾದ ಉಲ್ಲೇಖವೂ ಸಹ ಸುಳ್ಳೇ ಆಗಿರುತ್ತದೆ.

ಇದು ಕೇವಲ ಶೈಕ್ಷಣಿಕ ಪ್ರಬಂಧಗಳಿಗೆ ಮಾತ್ರ ಅನ್ವಯಿಸುವುದಿಲ್ಲ. AI ಒಂದು JIRA ಟಿಕೆಟ್, CVE ಸಂಖ್ಯೆ ಅಥವಾ ಕೋಡ್ ಕಮಿಟ್ ಅನ್ನು ಉಲ್ಲೇಖಿಸಿದರೆ, ನೀವು ಅದನ್ನು ನಿಜವಾದ ವ್ಯವಸ್ಥೆಯೊಂದಿಗೆ ಪರಿಶೀಲಿಸಬೇಕು.

AI ಆರ್ಕಿಟೆಕ್ಚರ್‌ನಲ್ಲಿನ ದೊಡ್ಡ ತಪ್ಪು ಎಂದರೆ ಮಾಡೆಲ್ ತನ್ನನ್ನು ತಾನೇ ಪರಿಶೀಲಿಸುವುದನ್ನು ನಂಬುವುದು. ಪರಿಶೀಲನೆಯು ಒಂದು ಪ್ರತ್ಯೇಕ ಹಂತವಾಗಿರಬೇಕು. ಬಳಕೆದಾರರು ಫಲಿತಾಂಶವನ್ನು ನೋಡುವ ಮೊದಲು ಅದು ಬಾಹ್ಯ ಸತ್ಯದ ಮೂಲಕ್ಕೆ (external source of truth) ಸಂಪರ್ಕ ಹೊಂದಿರಬೇಕು.

ಮಾಡೆಲ್‌ಗಳನ್ನು ಹೆಚ್ಚು ಪ್ರಾಮಾಣಿಕವಾಗಿಸಲು ಪ್ರಯತ್ನಿಸಬೇಡಿ. ಅವು ಪಠ್ಯ ಜನರೇಟರ್‌ಗಳಾಗಿವೆ ಮತ್ತು ಅವು ಯಾವಾಗಲೂ ಭ್ರಮೆಗೊಳಿಸುತ್ತವೆ (hallucinate). ಬದಲಾಗಿ, ಅವು ಹೇಳಿದ್ದನ್ನು ಕುರುಡಾಗಿ ನಂಬುವುದನ್ನು ನಿಲ್ಲಿಸಿ.

ನೀವು ರಿಜಿಸ್ಟ್ರಿಯ ಮೂಲಕ ಪರಿಶೀಲಿಸಲು ಸಾಧ್ಯವಾಗದ ಉಲ್ಲೇಖವು ಉಲ್ಲೇಖವಲ್ಲ. ಅದು ಲ್ಯಾಬ್ ಕೋಟ್ ಧರಿಸಿದ ಕಲ್ಪಿತ ಊಹೆವಷ್ಟೇ.

ಮೂಲ: https://dev.to/ohugonnot/stop-asking-the-llm-whether-its-source-is-real-2oaa

ಐಚ್ಛಿಕ ಕಲಿಕಾ ಸಮುದಾಯ: https://t.me/GyaanSetuAi