کپی کردن سبک کانال بدون نیاز به تیم طراحی
برای کپی کردن یک سبک بصری موفق در یوتیوب، نیازی به تیم طراحی ندارید. شما به یک خط لوله داده (data pipeline) نیاز دارید.
من مدیریت محتوای چندین کانال یوتیوب را بر عهده دارم. یکی از مشتریان من نرخ کلیک (CTR) ۲.۱ درصدی داشت، در حالی که رقیب آنها بین ۶ تا ۸ درصد بود. مشکل از محتوا نبود؛ مشکل از سیگنالهای بصری بود.
من یک سیستم خودکار برای کپی کردن سبکهای موفق ساختم. در اینجا آنچه آموختم را آوردهام.
چگونه سبک را تعریف کنیم سبک یک «حس و حال» (vibe) نیست، بلکه دادههای قابل اندازهگیری است. من پنج سیگنال خاص را دنبال کردم:
- نسبت برش صورت (Face crop ratio): میزان فضایی که صورت اشغال میکند.
- دستهبندی حالت چهره: دهان باز یا ابروهای بالا رفته.
- ناحیه متن: محل قرارگیری عنوان در کادر.
- اختلاف کنتراست (Contrast delta): تفاوت روشنایی بین سوژه و پسزمینه.
- دمای رنگ: تنهای گرم یا سرد.
خط لوله داده (The Data Pipeline) بزرگترین اشتباه، دادههای ورودی نامناسب است. من در ابتدا سعی کردم با استفاده از KMeans رنگها را استخراج کنم، اما شکست خوردم چون رنگهای پسزمینه مثل آسمان را هم استخراج میکرد. من این مشکل را با استفاده از MediaPipe برای ماسک کردن (mask) اولیه سوژه حل کردم. این کار باعث شد فقط رنگهای واقعی برند که مربوط به خود شخص بود را استخراج کنم.
مجموعه ابزارها (The Tooling Stack) من کار را به دو بخش تقسیم کردم، زیرا یک ابزار نمیتواند همه کارها را انجام دهد.
- کارهای مربوط به چهره: من از Aragon.ai برای مدیریت حالتهای چهره استفاده کردم.
- پسزمینه و لایهها: من از Thumbs.ai استفاده کردم. این ابزار به خوبی کار میکند زیرا URLهای مستقیم برای آپلود فراهم میکند.
نتایج نرخ کلیک مشتری در عرض هشت هفته از ۲.۱ درصد به ۳.۷ درصد رسید.
مهمترین عوامل برای کلیک شدن، نسبت برش صورت و کنتراست بودند. برخلاف انتظار، حالت خاص چهره اهمیت کمتری نسبت به آنچه فکر میکردم داشت.
درسهایی برای سازندگان
- قبل از استخراج رنگها، سوژه را ماسک کنید.
- سبک را با استفاده از ریاضیات تعریف کنید، نه احساسات.
- برای چهرهها و پسزمینهها از ابزارهای مختلف استفاده کنید.
- از همان ابتدا منطق تلاش مجدد (retry logic) را در کد خود پیادهسازی کنید.
- انتخاب فونت را به عنوان یک وظیفه تایپوگرافی در نظر بگیرید، نه یک وظیفه هوش مصنوعی.