నేను ఒక YouTube ఫీడ్‌బ్యాక్ లూప్‌ను ఎలా నిర్మించాను

నేను ఒక ఆటోమేటెడ్ YouTube ఛానెల్‌ని నడుపుతున్నాను. ప్రతిరోజూ, ఒక పైప్‌లైన్ స్క్రిప్ట్‌లను రూపొందిస్తుంది మరియు వీడియోలను రెండర్ చేస్తుంది.

నెలల తరబడి, ఈ వ్యవస్థ ఎటువంటి ఫీడ్‌బ్యాక్ లేకుండా పనిచేసింది. ఏది పని చేసింది లేదా ఏది విఫలమైందో తెలియకుండానే స్క్రిప్ట్ జనరేటర్ కంటెంట్‌ను రూపొందించేది. నాకు ఎటువంటి ఫీడ్‌బ్యాక్ లూప్ లేదు.

గత వారం, నేను 330 లైన్ల Python స్క్రిప్ట్‌తో దీనిని పరిష్కరించాను. ఇది పనితీరు (performance) మరియు సృష్టి (creation) మధ్య ఒక క్లోజ్డ్ లూప్‌ను సృష్టిస్తుంది.

ఇది ఎలా పనిచేస్తుందో ఇక్కడ ఉంది:

• డేటా సేకరణ (Data Collection): గత 30 వీడియోలను చదవడానికి ఈ స్క్రిప్ట్ YouTube Data API v3ని ఉపయోగిస్తుంది. • వర్గీకరణ (Classification): వీడియోలను ర్యాంక్ చేయడానికి ఇది మీడియన్-ఆధారిత త్రెషోల్డ్‌ను (median-based threshold) ఉపయోగిస్తుంది.

  • HIGH: మీడియన్‌ కంటే 1.5x కంటే ఎక్కువ వ్యూస్ ఉన్న వీడియోలు.
  • LOW: మీడియన్‌ కంటే 0.6x కంటే తక్కువ వ్యూస్ ఉన్న వీడియోలు (అవి 72 గంటల కంటే పాతవి అయితే మాత్రమే).
  • నాయిస్‌ను (noise) నివారించడానికి మిగిలినవన్నీ విస్మరించబడతాయి. • ప్యాటర్న్ మ్యాచింగ్ (Pattern Matching): టైటిల్ పదాలను సరిపోల్చడం ద్వారా, ఈ స్క్రిప్ట్ పనితీరును ట్యుటోరియల్స్ లేదా పోలికల వంటి "ఆర్కిటైప్స్" (archetypes) తో అనుసంధానిస్తుంది. • హుక్ అనాలిసిస్ (Hook Analysis): స్క్రిప్ట్‌లోని మొదటి పదం ప్రశ్నకా, సంఖ్యకా లేదా వ్యక్తిగత ప్రకటనకా అని ఇది తనిఖీ చేస్తుంది. • ఆటోమేటెడ్ అప్‌డేట్స్ (Automated Updates): ఫలితాలు ఒక markdown ఫైల్‌లోకి "bias hints"ను రాస్తాయి.

స్క్రిప్ట్ జనరేటర్ తదుపరి స్క్రిప్ట్‌ను రాసే ముందు ఈ ఫైల్‌ను చదువుతుంది. ఏ ప్యాటర్న్‌లు విజయవంతమవుతున్నాయో మరియు ఏ ప్యాటర్న్‌లు విఫలమవుతున్నాయో అది చూస్తుంది. రేపటి కోసం మెరుగైన ఎంపికలు చేయడానికి ఇది ఈ సందర్భాన్ని (context) ఉపయోగిస్తుంది.

నేను ఈ విధానాన్ని ఎందుకు ఎంచుకున్నాను:

  • మీన్ (Mean) కంటే మీడియన్ (Median): ఒక వైరల్ వీడియో మీన్ సగటును దెబ్బతీస్తుంది. కానీ మీడియన్ స్థిరంగా ఉంటుంది.
  • 72-గంటల నియమం: కొత్త వీడియోలకు సమయం కావాలి. ఒక వీడియో కేవలం ఒక రోజు మాత్రమే పాతది అయినంత మాత్రాన దానిని నేను విఫలమైనదిగా పరిగణించను.
  • సింపుల్ హ్యూరిస్టిక్స్ (Simple Heuristics): ఖరీదైన LLM కాల్స్ బదులుగా ప్రస్తుతానికి నేను మొదటి పదం గుర్తింపును (first-word detection) ఉపయోగిస్తున్నాను. ఇది వేగంగా మరియు తక్కువ ఖర్చుతో కూడుకున్నది.

ఇది మ్యాజిక్ కాదు. ఇది తన స్వంత డేటా నుండి నేర్చుకునే ఒక వ్యవస్థ.

దీని లక్ష్యం మానవ తీర్పును భర్తీ చేయడం కాదు, జనరేటర్‌కు మెరుగైన సందర్భాన్ని (context) అందించడం. ప్రతి 24 గంటలకు మరింత తెలివైనదిగా మారే వ్యవస్థను నేను నిర్మిస్తున్నాను.

Source: https://dev.to/morinaga/how-i-built-a-youtube-performance-classifier-that-adjusts-tomorrows-video-script-bias-19ba

Optional learning community: https://t.me/GyaanSetuAi