YouTube எடிட்டர்களுக்கான AI ஆட்டோமேஷன்
ஒரு YouTube வீடியோவைச் சிறப்பானதாக மாற்றக்கூடிய அந்தச் சில வினாடிகளைக் கண்டறிய, பல மணிநேர மூலக் காட்சிகளைத் (raw footage) தேடி ஆராய்வது மிகவும் சோர்வானது. எந்தத் தருணங்கள் பார்வையாளர்களைக் கவரும் என்று யூகிப்பதிலேயே தனிப்பட்ட எடிட்டர்கள் பெரும்பாலும் நேரத்தை வீணடிக்கிறார்கள். இது வீடியோவின் வேகத்தைச் சீரற்றதாக்குவதோடு, சிறந்த வாய்ப்புகளையும் இழக்கச் செய்கிறது. AI இந்த யூகிக்கும் முறையை ஒரு மீண்டும் செய்யக்கூடிய (repeatable) செயல்முறையாக மாற்றுகிறது.
மூன்று அடுக்கு கட்டமைப்பு
முக்கியத் தருணங்களைத் (highlights) தேர்ந்தெடுப்பதை ஆட்டோமேட் செய்ய மிகவும் நம்பகமான வழி, ஒரு மூன்று அடுக்கு குழாய்வழி முறையை (three-layer pipeline) பயன்படுத்துவதாகும்.
- அடுக்கு 1 ஒரு பரந்த வலை போன்றது. இது ஆடியோ ஸ்பைக்கிகள் (audio spikes) மற்றும் வேகமான பேச்சு போன்ற குறைந்த செலவிலான சிக்னல்களைப் பயன்படுத்தி, வழக்கமான நிலையிலிருந்து மாறுபடும் பகுதிகளைக் கண்டறிகிறது.
- அடுக்கு 2 ஒரு துல்லியமான கொக்கி போன்றது. இது டிரான்ஸ்கிரிப்ட் (transcript) மூலம் அந்தப் பகுதிகளைச் செம்மைப்படுத்துகிறது. பல உயர்-நம்பிக்கை சிக்னல்களைக் கொண்ட தருணங்களைத் தக்கவைக்க, இது உணர்வு பகுப்பாய்வு (sentiment analysis) மற்றும் முகபாவனை மதிப்பெண் முறையைப் பயன்படுத்துகிறது.
- அடுக்கு 3 என்பது மனித-AI மதிப்பாய்வு ஆகும். எடிட்டர் அந்த வரிசையைச் சரிபார்த்து, கதவு மூடும் சத்தம் அல்லது இருமல் போன்ற தவறான சிக்னல்களை (false positives) நீக்குகிறார். இது கிளிப்புகள் ஒரு கதையைச் சொல்வதை உறுதி செய்கிறது.
இதற்காக நீங்கள் Azure Face API என்ற கருவியைப் பயன்படுத்தலாம். இது ஆச்சரியம், மகிழ்ச்சி அல்லது ஒருமுகப்படுத்துதல் போன்றவற்றை மதிப்பிட முகபாவனை கண்டறிதலை (facial expression detection) வழங்குகிறது.
ஒரு ஆச்சரியமான விஷயத்தைக் கூறிய பிறகு தொகுப்பாளர் சிரிக்கும் இரண்டு மணிநேர பாட்காஸ்ட்டை (podcast) எடிட் செய்வதாகக் கற்பனை செய்து பாருங்கள். அடுக்கு 1 ஆடியோ ஸ்பைக்கைக் கண்டறிகிறது. அடுக்கு 2 டிரான்ஸ்கிரிப்ட்டில் சிரிப்பைக் கண்டறிந்து, Azure Face API மூலம் மகிழ்ச்சி மதிப்பெண் அதிகரிப்பதைக் கவனிக்கிறது. அடுக்கு 3, அந்தத் துணுக்குத் டைம்லைனில் (timeline) சேர்க்கப்படுவதற்கு முன்பு, அது ஒரு முக்கியத் தருணமாக (punchline) அமையும் என்பதை உறுதிப்படுத்துகிறது.
செயல்படுத்தும் படிகள்
மூலக் கோப்பில் (raw file) வேகமான ஆடியோ மற்றும் பேச்சுப் பகுப்பாய்வைச் செய்யவும். சத்தம் அல்லது நிமிடத்திற்குப் பேசப்படும் சொற்களின் எண்ணிக்கை 20 சதவீதத்திற்கு மேல் அதிகரிக்கும் எந்தப் பகுதியையும் அடையாளப்படுத்த (markers) குறிகாட்டிகளை உருவாக்கவும்.
அடையாளப்படுத்தப்பட்ட பகுதிகளை ஒரு டிரான்ஸ்கிரிப்ஷன் சேவைக்கு அனுப்பவும். உணர்வு மதிப்பெண் முறையை (sentiment scoring) இயக்கி, தூண்டுதல் சொற்றொடர்களைத் (trigger phrases) தேடவும். குறைந்தது இரண்டு சிக்னல்கள் ஒத்துப்போகும் பகுதிகளை மட்டும் தக்கவைக்க முகபாவனை மதிப்பெண் முறையைப் பயன்படுத்தவும்.
குறிகாட்டிகளை உங்கள் எடிட்டிங் மென்பொருளுக்குள் இறக்குமதி செய்யவும். தவறான சிக்னல்களை நீக்க அவற்றை அடுத்தடுத்துப் பார்க்கவும். எஞ்சியிருக்கும் பகுதிகள் ஒரு தெளிவான கதையோட்டத்தை உருவாக்குவதை உறுதி செய்ய அவற்றை வரிசைப்படுத்தவும்.
அடுக்குமுறை அணுகுமுறை, இரைச்சல் மிகுந்த கண்டறிதலில் இருந்து துல்லியமானத் தேர்வைப் பிரிக்கிறது. ஆடியோ ஸ்பைக்கிகள், பேச்சின் வேகம், உணர்வு உச்சங்கள் மற்றும் முகபாவனை மதிப்பெண்களை இணைப்பதன் மூலம் அதிக நம்பிக்கையளிக்கக்கூடிய முக்கியத் தருணங்களைப் பெற முடியும். தவறுகளைத் திருத்தவும் இறுதித் கதையை வடிவமைக்கவும் மனித மேற்பார்வை அவசியமானது.
ஆதாரம்: https://dev.to/ken_deng_ai/title-25n9
விருப்பத்தேர்வு கற்றல் சமூகம்: https://t.me/GyaanSetuAi