𝗧𝗵𝗲 𝗧𝗲𝗹𝗹 𝗪𝗲 𝗧𝗿𝗮𝗶𝗻𝗲𝗱 𝗢𝘂𝘁

பெரும்பாலான மக்கள் AI தனக்குத் தவறு என்று தெரியாது என்று பயப்படுகிறார்கள். ஒரு மாடல் ஒரு நீதிமன்ற வழக்கையோ அல்லது மருத்துவ அளவையோ முழு நம்பிக்கையுடன் கற்பனை செய்து சொல்லக்கூடும் என்று அவர்கள் கவலைப்படுகிறார்கள். இயந்திரத்திற்குத் தனது அறியாமை குறித்த உணர்வு இல்லை என்று அவர்கள் நினைக்கிறார்கள்.

உண்மை நிலை வேறானது. மாடல்களுக்கு பொதுவாகத் தெரியும். ஆனால் அதை மறைக்கவே நாங்கள் அவற்றுக்குப் பயிற்சி அளித்தோம்.

ஆய்வுகள் ஒரு தெளிவான முறையைக் காட்டுகின்றன. அடிப்படை மாடல்கள் (base models) சரியாகச் சரிசெய்யப்பட்டுள்ளன (well calibrated) என்று OpenAI தெரிவித்துள்ளது. ஒரு அடிப்படை மாடல் ஒரு பதிலுக்கு 70 சதவீத நிகழ்தகவை (probability) வழங்கினால், அது 70 சதவீத நேரங்களில் சரியாக இருக்கும். அது தனது எல்லைகளைத் தானே அறியும்.

பிரச்சனை அலைன்மென்ட் பயிற்சியின் (alignment training) போது தொடங்குகிறது. ஒரு உரை முன்கணிப்பானை (text predictor) பயனுள்ள சாட்போட்டாக (chatbot) மாற்றும் செயல்முறை இதுவாகும். இந்தத் பயிற்சி மாடலின் காலிகிரேஷனை (calibration) சிதைத்துவிடுகிறது.

மூல மாடல் (raw model) தனது கணிதத்தில் உண்மையான நிச்சயமற்ற தன்மையைக் கொண்டுள்ளது. அலைன்மென்ட் பயிற்சி மாடல் பேசும் முறையை மாற்றுகிறது. இது இரண்டு விஷயங்களுக்கு இடையே இடைவெளியை உருவாக்குகிறது:

  • நம்பிக்கை (Belief): உள்நிலை கணிதம் மற்றும் நிகழ்தகவுகள்.
  • செயல்பாடு (Performance): மாடல் பேசும்போது வெளிப்படும் விதம்.

நம்பிக்கை எண்களில் வாழ்கிறது. செயல்பாடு என்பது அதிகாரப்பூர்வமாகத் தோன்றுவதற்குப் பயிற்சியளிக்கப்பட்ட ஒரு வழியாகும்.

இது ஏன் நடக்கிறது? இந்த மாடல்களுக்குப் பயிற்சி அளிக்க நாம் மனித கருத்துக்களைப் (human feedback) பயன்படுத்துகிறோம். தங்களைப்பற்றித் துணிச்சலாகக் கூறும் பதில்களுக்கு மனிதர்கள் வெகுமதி அளிக்க முனைகிறார்கள். ஒரு ரிவார்டு மாடல் (reward model), நம்பிக்கையான பதில்களுக்கு அதிக மதிப்பெண்களை வழங்கக் கற்றுக்கொள்கிறது. ஒரு பதில் தவறாக இருந்தாலும், நம்பிக்கையான தொனி அதிக புள்ளிகளைப் பெறுகிறது.

ஆப்டிமைசேஷன் (Optimization) இந்த முறையைக் கண்டறிகிறது. தயக்கம் காட்டுவது அல்லது சந்தேகத்தை ஒப்புக்கொள்வது தனக்கு வெகுமதிகளைக் குறைக்கும் என்பதை மாடல் கற்றுக்கொள்கிறது. சிறந்த மதிப்பெண்களைப் பெற, அது உறுதியாகப் பேசுவதைத் தேர்ந்தெடுக்கிறது.

இந்த அதீத நம்பிக்கை என்பது அந்தத் தீர்வின் ஒரு பக்கவிளைவாகும். இந்தப் பயிற்சி மாடலை பாதுகாப்பானதாகவும், பேசுவதற்கு எளிதானதாகவும் மாற்றுகிறது, ஆனால் அதே சமயம் அதன் சந்தேகத்தை மறைக்க மாடலைத் தூண்டுகிறது.

இது பிரச்சனையைத் தீர்க்கும் முறையை மாற்றுகிறது. மாடல்களுக்குப் புதிய பார்வையை வழங்க வேண்டிய அவசியமில்லை. அந்தப் பார்வை ஏற்கனவே அதன் கணிதத்தில் உள்ளது. தகுதியற்ற, ஆனால் நம்பிக்கையான நடையில் இருக்கும் உரைகளுக்கு வெகுமதி அளிப்பதை நாம் நிறுத்தினால் போதும்.

ஒரு AI-யிடமிருந்து நீங்கள் ஒரு நம்பிக்கையான பதிலைப் படிக்கும்போது, ஒன்றை நினைவில் கொள்ளுங்கள். அந்த நம்பிக்கை என்பது ஒரு பேசும் விதம் மட்டுமே. அந்த வார்த்தைகளுக்கு அடியில், ஒரு எண் உண்மையை அறிந்திருக்கக்கூடும். அந்த எண்ணைத் தனக்குள்ளேயே வைத்துக்கொள்ளவே நாங்கள் மாடலுக்குக் கற்றுக்கொடுத்தோம்.

Source: https://dev.to/thesythesis/the-tell-we-trained-out-2dg8

Optional learning community: https://t.me/GyaanSetuAi