Stop Asking LLMs If Their Sources Are Real

Translated for your language. Read the original.

AI-assisted draft.

GyaanSetu Editorial6 நாட்களுக்கு முன்2min read

Stop Asking LLMs If Their Sources Are Real

LLM-களிடம் அவற்றின் ஆதாரங்கள் உண்மையானவையா என்று கேட்பதை நிறுத்துங்கள்

நீங்கள் ஒரு AI-யிடம் ஆதாரங்களின் பட்டியலைக் கேட்கிறீர்கள். அது உங்களுக்குத் தலைப்புகள், ஆசிரியர்கள் மற்றும் DOIs-களை வழங்குகிறது. அனைத்தும் சரியாகத் தெரிகிறது. ஆனால் அவற்றில் பாதி உண்மையில் இல்லை என்பதை நீங்கள் பிறகு கண்டறிகிறீர்கள்.

அந்த DOI எதற்கும் வழிவகுப்பதில்லை. அந்த ஆய்வறிக்கை (paper) எழுதப்பட்டதே இல்லை.

"இது உண்மையானதுதானா?" என்று அந்த மாடலிடம் கேட்பதே உங்கள் இயல்பாக இருக்கும். AI அதற்கு 'ஆம்' என்றுதான் சொல்லும். அது எப்போதும் 'ஆம்' என்றுதான் சொல்லும். ஒரு போலி ஆவணத் தயாரிப்பாளரிடம் (forger) அவரது வேலை உண்மையானதா என்று கேட்பது போன்றது இது.

ஒரு LLM ஆய்வறிக்கைகளின் தரவுத்தளத்தைப் (database) பயன்படுத்துவதில்லை. அது ஒரு தொடரில் அடுத்த வார்த்தையைத் தான் கணிக்கிறது. ஒரு AI-க்கு, ஒரு மேற்கோள் (citation) என்பது வெறும் ஒரு வடிவம் (pattern) மட்டுமே. ஒரு மேற்கோளுக்கு ஒரு பெயர், ஒரு ஆண்டு மற்றும் பத்து இலக்கங்கள் தேவை என்பதை அது அறிந்துள்ளது. உண்மைத் தன்மையைக் கொண்டிருக்காமல், ஒரு உண்மையான ஆதாரத்தின் வடிவத்தை அது அப்படியே பிரதிபலிக்கிறது.

அந்த மாடல் தனது சொந்த வேலையைச் சரிபார்க்கச் சொல்வதை நிறுத்துங்கள். அதற்கு இரண்டு காரணங்களால் இது இயலாது:

அதற்கு நேரடிப் பதிவேடுகளின் (live registry) அணுகல் இல்லை. அது நம்பகமானதாகத் தோன்றும் உரையை மட்டுமே உருவாக்குகிறது.
தான் ஏற்கனவே சொன்னதை உறுதிப்படுத்தும் ஒரு சார்பு (bias) அதற்கு உள்ளது.

தகவல்களைச் சரிபார்க்க நீங்கள் வெளிப்புறக் கருவிகளைப் பயன்படுத்த வேண்டும். தொழில்நுட்ப எழுத்துக்களுக்கான (technical writing) மூன்று படிநிலை வடிகட்டி இதோ:

இருப்பு (Existence). Crossref போன்ற ஒரு API மூலம் DOI-ஐச் சரிபார்க்கவும். API ஒரு 404 பிழையைத் தந்தால், அந்த ஆதாரம் போலியானது. உருவாக்கப்பட்ட ஒரு DOI ஒருபோதும் செயல்படாது.
நம்பகத்தன்மை (Credibility). ஒரு ஆதாரம் இருக்கலாம், ஆனால் அது பயனற்றதாக இருக்கலாம். அந்த இதழ் (journal) அல்லது மாநாடு (conference) அங்கீகரிக்கப்பட்டதா என்று சரிபார்க்கவும். ஒரு சரியான DOI தரத்தை உறுதிப்படுத்தாது.
உண்மைத்தன்மை (Fidelity). அந்த ஆய்வறிக்கை உண்மையில் உங்கள் வாதத்தை ஆதரிக்கிறதா? நீங்கள் அதன் உள்ளடக்கத்தைப் படிக்க வேண்டும். சுருக்கம் (abstract) அனைத்து விவரங்களையும் உள்ளடக்கியிருக்கும் என்று assumptions வைத்துக்கொள்ளாதீர்கள். ஒரு தவறான வாதத்திற்காகப் பயன்படுத்தப்படும் உண்மையான மேற்கோளும் ஒரு பொய்யே.

இது கல்விசார் ஆய்வறிக்கைகளுக்கு மட்டுமல்லாமல் மற்றவற்றிற்கும் பொருந்தும். ஒரு AI ஒரு JIRA ticket, CVE எண் அல்லது code commit-ஐ மேற்கோள் காட்டினால், நீங்கள் அதை உண்மையான அமைப்போடு (actual system) ஒப்பிட்டுச் சரிபார்க்க வேண்டும்.

AI கட்டமைப்பில் (architecture) செய்யப்படும் மிகப்பெரிய தவறு, மாடல் தானாகவே சரிபார்க்கும் என்று நம்புவதுதான். சரிபார்ப்பு என்பது ஒரு தனிப் படிநிலையாக இருக்க வேண்டும். பயனர் முடிவைப் பார்ப்பதற்கு முன்பே, அது ஒரு வெளிப்புற உண்மை ஆதாரத்துடன் (external source of truth) இணைக்கப்பட்டிருக்க வேண்டும்.

மாடல்களை அதிக நேர்மையானதாக மாற்ற முயற்சிக்காதீர்கள். அவை உரைத் தயாரிப்பிகள் (text generators), மேலும் அவை எப்போதும் மாயத்தோற்றங்களை (hallucinate) உருவாக்கும். அதற்குப் பதிலாக, அவை சொல்வதை அப்படியே நம்புவதை நிறுத்துங்கள்.

ஒரு பதிவேட்டின் மூலம் நீங்கள் சரிபார்க்க முடியாத மேற்கோள், ஒரு மேற்கோள் அல்ல. அது ஆய்வக உடை அணிந்த ஒரு யூகமே.

Source: https://dev.to/ohugonnot/stop-asking-the-llm-whether-its-source-is-real-2oaa

Optional learning community: https://t.me/GyaanSetuAi

Stop Asking LLMs If Their Sources Are Real

LLM-களிடம் அவற்றின் ஆதாரங்கள் உண்மையானவையா என்று கேட்பதை நிறுத்துங்கள்

Continue reading

உண்மையின் ஆதாரப் பிரச்சனை

LLM ப்ராம்ப்டிங்கில் தேர்ச்சி பெறுதல்: ஒரு டெவலப்பருக்கான வழிகாட்டி

உண்மைகளைச் சிதைக்காமல் நாங்கள் எவ்வாறு AI-ஐப் பயன்படுத்துகிறோம்

2026-இல் உள்ளூர் AI தேடல்: உண்மைத் தகவலின் ஆதாரம் குறித்த சிக்கல்