YouTube 피드백 루프를 구축한 방법

저는 자동화된 YouTube 채널을 운영하고 있습니다. 매일 파이프라인이 스크립트를 생성하고 영상을 렌더링합니다.

수개월 동안 이 시스템은 외부 정보 없이 독자적으로 작동했습니다. 스크립트 생성기는 무엇이 성공하고 무엇이 실패했는지 모른 채 콘텐츠를 제작했습니다. 저에게는 피드백 루프가 없었습니다.

지난주, 저는 330줄짜리 Python 스크립트로 이 문제를 해결했습니다. 이 스크립트는 성과와 제작 사이에 폐쇄 루프(closed loop)를 형성합니다.

작동 방식은 다음과 같습니다:

• 데이터 수집: 스크립트는 YouTube Data API v3를 사용하여 최근 30개의 영상을 읽어옵니다. • 분류: 중앙값(median) 기반의 임계값을 사용하여 영상을 순위화합니다.

  • 높음(HIGH): 조회수가 중앙값의 1.5배 이상인 영상.
  • 낮음(LOW): 조회수가 중앙값의 0.6배 미만인 영상 (단, 업로드 후 72시간이 지난 경우에만 해당).
  • 노이즈를 피하기 위해 그 외의 데이터는 무시합니다. • 패턴 매칭: 스크립트는 제목의 단어들을 매칭하여 성과를 튜토리얼이나 비교와 같은 "아키타입(archetypes)"에 연결합니다. • 후크(Hook) 분석: 스크립트의 첫 단어가 질문인지, 숫자인지, 아니면 개인적인 진술인지 확인합니다. • 자동 업데이트: 결과는 "편향 힌트(bias hints)"라는 이름으로 마크다운 파일에 기록됩니다.

스크립트 생성기는 다음 스크립트를 작성하기 전에 이 파일을 읽습니다. 어떤 패턴이 성공하고 어떤 패턴이 실패하는지 파악하는 것입니다. 생성기는 이 문맥(context)을 활용하여 내일을 위한 더 나은 선택을 합니다.

이 방식을 선택한 이유:

  • 평균(Mean) 대신 중앙값(Median) 사용: 영상 하나가 갑자기 조회수가 폭발(viral)하면 평균값이 망가질 수 있습니다. 하지만 중앙값은 안정적으로 유지됩니다.
  • 72시간 규칙: 새 영상에는 시간이 필요합니다. 단지 업로드된 지 하루밖에 되지 않았다고 해서 영상을 실패로 분류하지 않습니다.
  • 단순한 휴리스틱(Heuristics): 현재는 비용이 많이 드는 LLM 호출 대신 첫 단어 감지 방식을 사용합니다. 빠르고 저렴하기 때문입니다.

이것은 마법이 아닙니다. 자체 데이터로부터 학습하는 시스템입니다.

목표는 인간의 판단을 대체하는 것이 아니라, 생성기에게 더 나은 문맥을 제공하는 것입니다. 저는 24시간마다 점점 더 똑똑해지는 시스템을 구축하고 있습니다.

출처: https://dev.to/morinaga/how-i-built-a-youtube-performance-classifier-that-adjusts-tomorrows-video-script-bias-19ba

선택 사항 학습 커뮤니티: https://t.me/GyaanSetuAi