LLM-களிடம் அவற்றின் ஆதாரங்கள் உண்மையானவையா என்று கேட்பதை நிறுத்துங்கள்

நீங்கள் ஒரு AI-யிடம் ஆதாரங்களின் பட்டியலைக் கேட்கிறீர்கள். அது உங்களுக்குத் தலைப்புகள், ஆசிரியர்கள் மற்றும் DOIs-களை வழங்குகிறது. அனைத்தும் சரியாகத் தெரிகிறது. ஆனால் அவற்றில் பாதி உண்மையில் இல்லை என்பதை நீங்கள் பிறகு கண்டறிகிறீர்கள்.

அந்த DOI எதற்கும் வழிவகுப்பதில்லை. அந்த ஆய்வறிக்கை (paper) எழுதப்பட்டதே இல்லை.

"இது உண்மையானதுதானா?" என்று அந்த மாடலிடம் கேட்பதே உங்கள் இயல்பாக இருக்கும். AI அதற்கு 'ஆம்' என்றுதான் சொல்லும். அது எப்போதும் 'ஆம்' என்றுதான் சொல்லும். ஒரு போலி ஆவணத் தயாரிப்பாளரிடம் (forger) அவரது வேலை உண்மையானதா என்று கேட்பது போன்றது இது.

ஒரு LLM ஆய்வறிக்கைகளின் தரவுத்தளத்தைப் (database) பயன்படுத்துவதில்லை. அது ஒரு தொடரில் அடுத்த வார்த்தையைத் தான் கணிக்கிறது. ஒரு AI-க்கு, ஒரு மேற்கோள் (citation) என்பது வெறும் ஒரு வடிவம் (pattern) மட்டுமே. ஒரு மேற்கோளுக்கு ஒரு பெயர், ஒரு ஆண்டு மற்றும் பத்து இலக்கங்கள் தேவை என்பதை அது அறிந்துள்ளது. உண்மைத் தன்மையைக் கொண்டிருக்காமல், ஒரு உண்மையான ஆதாரத்தின் வடிவத்தை அது அப்படியே பிரதிபலிக்கிறது.

அந்த மாடல் தனது சொந்த வேலையைச் சரிபார்க்கச் சொல்வதை நிறுத்துங்கள். அதற்கு இரண்டு காரணங்களால் இது இயலாது:

  • அதற்கு நேரடிப் பதிவேடுகளின் (live registry) அணுகல் இல்லை. அது நம்பகமானதாகத் தோன்றும் உரையை மட்டுமே உருவாக்குகிறது.
  • தான் ஏற்கனவே சொன்னதை உறுதிப்படுத்தும் ஒரு சார்பு (bias) அதற்கு உள்ளது.

தகவல்களைச் சரிபார்க்க நீங்கள் வெளிப்புறக் கருவிகளைப் பயன்படுத்த வேண்டும். தொழில்நுட்ப எழுத்துக்களுக்கான (technical writing) மூன்று படிநிலை வடிகட்டி இதோ:

  1. இருப்பு (Existence). Crossref போன்ற ஒரு API மூலம் DOI-ஐச் சரிபார்க்கவும். API ஒரு 404 பிழையைத் தந்தால், அந்த ஆதாரம் போலியானது. உருவாக்கப்பட்ட ஒரு DOI ஒருபோதும் செயல்படாது.

  2. நம்பகத்தன்மை (Credibility). ஒரு ஆதாரம் இருக்கலாம், ஆனால் அது பயனற்றதாக இருக்கலாம். அந்த இதழ் (journal) அல்லது மாநாடு (conference) அங்கீகரிக்கப்பட்டதா என்று சரிபார்க்கவும். ஒரு சரியான DOI தரத்தை உறுதிப்படுத்தாது.

  3. உண்மைத்தன்மை (Fidelity). அந்த ஆய்வறிக்கை உண்மையில் உங்கள் வாதத்தை ஆதரிக்கிறதா? நீங்கள் அதன் உள்ளடக்கத்தைப் படிக்க வேண்டும். சுருக்கம் (abstract) அனைத்து விவரங்களையும் உள்ளடக்கியிருக்கும் என்று assumptions வைத்துக்கொள்ளாதீர்கள். ஒரு தவறான வாதத்திற்காகப் பயன்படுத்தப்படும் உண்மையான மேற்கோளும் ஒரு பொய்யே.

இது கல்விசார் ஆய்வறிக்கைகளுக்கு மட்டுமல்லாமல் மற்றவற்றிற்கும் பொருந்தும். ஒரு AI ஒரு JIRA ticket, CVE எண் அல்லது code commit-ஐ மேற்கோள் காட்டினால், நீங்கள் அதை உண்மையான அமைப்போடு (actual system) ஒப்பிட்டுச் சரிபார்க்க வேண்டும்.

AI கட்டமைப்பில் (architecture) செய்யப்படும் மிகப்பெரிய தவறு, மாடல் தானாகவே சரிபார்க்கும் என்று நம்புவதுதான். சரிபார்ப்பு என்பது ஒரு தனிப் படிநிலையாக இருக்க வேண்டும். பயனர் முடிவைப் பார்ப்பதற்கு முன்பே, அது ஒரு வெளிப்புற உண்மை ஆதாரத்துடன் (external source of truth) இணைக்கப்பட்டிருக்க வேண்டும்.

மாடல்களை அதிக நேர்மையானதாக மாற்ற முயற்சிக்காதீர்கள். அவை உரைத் தயாரிப்பிகள் (text generators), மேலும் அவை எப்போதும் மாயத்தோற்றங்களை (hallucinate) உருவாக்கும். அதற்குப் பதிலாக, அவை சொல்வதை அப்படியே நம்புவதை நிறுத்துங்கள்.

ஒரு பதிவேட்டின் மூலம் நீங்கள் சரிபார்க்க முடியாத மேற்கோள், ஒரு மேற்கோள் அல்ல. அது ஆய்வக உடை அணிந்த ஒரு யூகமே.

Source: https://dev.to/ohugonnot/stop-asking-the-llm-whether-its-source-is-real-2oaa

Optional learning community: https://t.me/GyaanSetuAi