How I Built A YouTube Feedback Loop

நான் ஒரு தானியங்கி YouTube சேனலை நடத்தி வருகிறேன். ஒவ்வொரு நாளும், ஒரு pipeline ஸ்கிரிப்ட்களை உருவாக்கி வீடியோக்களை ரெண்டர் செய்கிறது.

பல மாதங்களாக, இந்த அமைப்பு எந்தத் தொடர்பும் இன்றி இயங்கியது. எது வெற்றியடைந்தது அல்லது எது தோல்வியடைந்தது என்பதை அறியாமல் ஸ்கிரிப்ட் ஜெனரேட்டர் உள்ளடக்கத்தை உருவாக்கியது. என்னிடம் எந்த feedback loop-உம் இல்லை.

கடந்த வாரம், 330 வரிகள் கொண்ட ஒரு Python ஸ்கிரிப்ட் மூலம் இதைச் சரிசெய்தேன். இது செயல்திறனுக்கும் (performance) படைப்புக்கும் (creation) இடையே ஒரு மூடிய சுழற்சியை (closed loop) உருவாக்குகிறது.

இது எவ்வாறு செயல்படுகிறது என்பது இங்கே:

• தரவு சேகரிப்பு (Data Collection): ஸ்கிரிப்ட் கடைசி 30 வீடியோக்களைப் படிக்க YouTube Data API v3-ஐப் பயன்படுத்துகிறது. • வகைப்படுத்துதல் (Classification): வீடியோக்களைத் தரவரிசைப்படுத்த இது median-அடிப்படையிலான வரம்பைப் (threshold) பயன்படுத்துகிறது.

  • உயர் (HIGH): median-ஐ விட 1.5 மடங்கு அதிகமான பார்வைகளைக் கொண்ட வீடியோக்கள்.
  • குறைந்த (LOW): median-ஐ விட 0.6 மடங்கு குறைவான பார்வைகளைக் கொண்ட வீடியோக்கள் (அவை 72 மணிநேரத்திற்கு மேலாக இருந்தால் மட்டுமே).
  • தேவையற்ற குழப்பங்களைத் தவிர்க்க மற்றவை புறக்கணிக்கப்படுகின்றன. • பேட்டர்ன் பொருத்தம் (Pattern Matching): தலைப்பு வார்த்தைகளை ஒப்பிடுவதன் மூலம், ஸ்கிரிப்ட் செயல்திறனை "archetypes" எனப்படும் பயிற்சிகள் (tutorials) அல்லது ஒப்பீடுகள் (comparisons) போன்றவற்றுடன் இணைக்கிறது. • ஹூக் பகுப்பாய்வு (Hook Analysis): ஒரு ஸ்கிரிப்ட்டின் முதல் வார்த்தை ஒரு கேள்வியா, எண்ணா அல்லது ஒரு தனிப்பட்ட கூற்றா என்பதை இது சரிபார்க்கிறது. • தானியங்கி புதுப்பிப்புகள் (Automated Updates): முடிவுகள் ஒரு markdown கோப்பில் "bias hints"-களை எழுதுகின்றன.

ஸ்கிரிப்ட் ஜெனரேட்டர் அடுத்த ஸ்கிரிப்டை எழுதுவதற்கு முன் இந்த கோப்பைப் படிக்கிறது. எந்த மாதிரியான பேட்டர்ன்கள் வெற்றி பெறுகின்றன மற்றும் எவை தோல்வியடைகின்றன என்பதை அது பார்க்கிறது. நாளை சிறந்த முடிவுகளை எடுக்க இந்தத் தகவலை (context) அது பயன்படுத்துகிறது.

நான் ஏன் இந்த அணுகுமுறையைத் தேர்ந்தெடுத்தேன்:

  • சராசரியை (Mean) விட Median: ஒரு வைரல் வீடியோ சராசரியை (mean average) பாதித்துவிடக்கூடும். ஆனால் median நிலையாக இருக்கும்.
  • 72-மணிநேர விதி: புதிய வீடியோக்களுக்கு நேரம் தேவை. ஒரு வீடியோ ஒரு நாள் பழமையானது என்பதற்காகவே அதைத் தோல்வி என்று நான் முத்திரை குத்த மாட்டேன்.
  • எளிய வழிமுறைகள் (Simple Heuristics): தற்போது செலவு மிகுந்த LLM அழைப்புகளுக்குப் பதிலாக, முதல் வார்த்தையைக் கண்டறியும் முறையைப் பயன்படுத்துகிறேன். இது வேகமானது மற்றும் மலிவானது.

இது மந்திரம் அல்ல. இது தனது சொந்தத் தரவிலிருந்து கற்றுக்கொள்ளும் ஒரு அமைப்பு.

இதன் நோக்கம் மனிதத் தீர்ப்பை (human judgment) மாற்றுவதல்ல, மாறாக ஜெனரேட்டருக்குச் சிறந்த சூழலை (context) வழங்குவதாகும். ஒவ்வொரு 24 மணிநேரமும் புத்திசாலித்தனமாக மாறும் ஒரு அமைப்பை நான் உருவாக்கி வருகிறேன்.

Source: https://dev.to/morinaga/how-i-built-a-youtube-performance-classifier-that-adjusts-tomorrows-video-script-bias-19ba

Optional learning community: https://t.me/GyaanSetuAi