디자인 팀 없이 채널 스타일 복제하기

성공적인 YouTube 비주얼 스타일을 복제하는 데 디자인 팀은 필요하지 않습니다. 필요한 것은 데이터 파이프라인입니다.

저는 여러 YouTube 채널의 콘텐츠를 관리하고 있습니다. 한 클라이언트의 CTR은 2.1%였습니다. 반면 경쟁사의 CTR은 6%에서 8%에 달했습니다. 이것은 콘텐츠의 문제가 아니라, 비주얼 시그널(visual signal)의 문제였습니다.

저는 성공적인 스타일을 복제하기 위해 자동화된 시스템을 구축했습니다. 그 과정에서 배운 점들을 공유합니다.

스타일을 정의하는 방법 스타일은 단순히 '느낌(vibe)'이 아닙니다. 측정 가능한 데이터입니다. 저는 다섯 가지 특정 시그널을 추적했습니다:

  • 얼굴 크롭 비율(Face crop ratio): 얼굴이 차지하는 공간의 정도.
  • 표정 카테고리(Expression category): 입을 벌리고 있는지 또는 눈썹을 올렸는지 등.
  • 텍스트 영역(Text zone): 프레임 내에서 제목이 위치하는 곳.
  • 대비 차이(Contrast delta): 피사체와 배경 사이의 밝기 차이.
  • 색온도(Color temperature): 따뜻한 톤 또는 차가운 톤.

데이터 파이프라인 가장 큰 실수는 잘못된 입력 데이터입니다. 처음에는 KMeans를 사용하여 색상을 추출하려고 시도했습니다. 하지만 하늘과 같은 배경색까지 추출되는 바람에 실패했습니다. 저는 MediaPipe를 사용하여 먼저 피사체를 마스킹(mask)함으로써 이 문제를 해결했습니다. 이를 통해 인물로부터 실제 브랜드 컬러만을 정확하게 캡처할 수 있었습니다.

툴 스택(Tooling Stack) 하나의 도구로 모든 것을 할 수는 없기에 작업을 두 부분으로 나누었습니다.

  • 얼굴 작업: 얼굴 표정을 처리하기 위해 Aragon.ai를 사용했습니다.
  • 배경 및 레이어: Thumbs.ai를 사용했습니다. 이 도구는 업로드를 위한 직접적인 URL을 제공하기 때문에 작업 효율이 좋습니다.

결과 클라이언트의 CTR은 8주 만에 2.1%에서 3.7%로 상승했습니다.

클릭을 유도하는 가장 중요한 요소는 얼굴 크롭 비율과 대비였습니다. 놀랍게도, 구체적인 얼굴 표정은 생각보다 큰 영향을 미치지 않았습니다.

빌더를 위한 교훈

  • 색상을 추출하기 전에 피사체를 먼저 마스킹하세요.
  • 느낌이 아닌 수학을 사용하여 스타일을 정의하세요.
  • 얼굴과 배경에 각각 다른 도구를 사용하세요.
  • 코드에 재시도 로직(retry logic)을 조기에 구축하세요.
  • 폰트 선택은 AI 작업이 아닌 타이포그래피 작업으로 취급하세요.

출처: https://dev.to/wolve_kansu_15b695ed036a8/clone-channel-style-without-a-design-team-what-actually-works-362h