আমি কীভাবে একটি YouTube ফিডব্যাক লুপ তৈরি করলাম

আমি একটি স্বয়ংক্রিয় YouTube চ্যানেল পরিচালনা করি। প্রতিদিন একটি পাইপলাইন স্ক্রিপ্ট তৈরি করে এবং ভিডিও রেন্ডার করে।

কয়েক মাস ধরে সিস্টেমটি বিচ্ছিন্নভাবে কাজ করছিল। স্ক্রিপ্ট জেনারেটর কী সফল হচ্ছে বা কী ব্যর্থ হচ্ছে তা না জেনেই কন্টেন্ট তৈরি করছিল। আমার কোনো ফিডব্যাক লুপ ছিল না।

গত সপ্তাহে, আমি একটি ৩৩০ লাইনের Python স্ক্রিপ্টের মাধ্যমে এটি সমাধান করেছি। এটি পারফরম্যান্স এবং তৈরির কাজের মধ্যে একটি ক্লোজড লুপ তৈরি করে।

এটি যেভাবে কাজ করে:

• ডেটা সংগ্রহ (Data Collection): স্ক্রিপ্টটি শেষ ৩০টি ভিডিও পড়ার জন্য YouTube Data API v3 ব্যবহার করে। • ক্লাসিফিকেশন (Classification): এটি ভিডিওর র‍্যাঙ্কিং করার জন্য একটি মিডিয়ান-ভিত্তিক থ্রেশহোল্ড (median-based threshold) ব্যবহার করে।

  • HIGH: যেসব ভিডিওর ভিউ মিডিয়ানের ১.৫ গুণ বেশি।
  • LOW: যেসব ভিডিওর ভিউ মিডিয়ানের ০.৬ গুণের কম (শুধুমাত্র যদি সেগুলো ৭২ ঘণ্টার বেশি পুরনো হয়)।
  • নয়েজ এড়াতে বাকি সবকিছু উপেক্ষা করা হয়। • প্যাটার্ন ম্যাচিং (Pattern Matching): স্ক্রিপ্টটি টাইটেলের শব্দগুলোর মিল খুঁজে বের করার মাধ্যমে পারফরম্যান্সকে টিউটোরিয়াল বা তুলনামূলক আলোচনার মতো "আর্কিটাইপ"-এর সাথে যুক্ত করে। • হুক অ্যানালাইসিস (Hook Analysis): এটি একটি স্ক্রিপ্টের প্রথম শব্দটি পরীক্ষা করে দেখে যে সেটি কোনো প্রশ্ন, সংখ্যা নাকি ব্যক্তিগত বক্তব্য। • স্বয়ংক্রিয় আপডেট (Automated Updates): ফলাফলগুলো একটি markdown ফাইলে "bias hints" হিসেবে লিখে রাখে।

স্ক্রিপ্ট জেনারেটর পরবর্তী স্ক্রিপ্ট লেখার আগে এই ফাইলটি পড়ে। এটি দেখে কোন প্যাটার্নগুলো সফল হচ্ছে এবং কোনগুলো ব্যর্থ হচ্ছে। এটি আগামীকালের জন্য আরও ভালো সিদ্ধান্ত নিতে এই প্রেক্ষাপট (context) ব্যবহার করে।

কেন আমি এই পদ্ধতিটি বেছে নিলাম:

  • গড় (Mean)-এর পরিবর্তে মিডিয়ান (Median): একটি ভাইরাল ভিডিও গড় (mean average) নষ্ট করে দিতে পারে। মিডিয়ান স্থিতিশীল থাকে।
  • ৭২-ঘণ্টার নিয়ম: নতুন ভিডিওর জন্য সময়ের প্রয়োজন। একটি ভিডিও মাত্র একদিন পুরনো হওয়ার কারণে আমি সেটিকে ব্যর্থ হিসেবে চিহ্নিত করি না।
  • সহজ হিউরিস্টিকস (Simple Heuristics): আমি আপাতত ব্যয়বহুল LLM কলের পরিবর্তে প্রথম শব্দ শনাক্তকরণ পদ্ধতি ব্যবহার করছি। এটি দ্রুত এবং সাশ্রয়ী।

এটি কোনো জাদু নয়। এটি এমন একটি সিস্টেম যা তার নিজস্ব ডেটা থেকে শেখে।

লক্ষ্য মানুষের বিচারবুদ্ধিকে প্রতিস্থাপন করা নয়, বরং জেনারেটরকে আরও ভালো প্রেক্ষাপট প্রদান করা। আমি এমন একটি সিস্টেম তৈরি করছি যা প্রতি ২৪ ঘণ্টায় আরও বুদ্ধিমান হয়ে ওঠে।

উৎস: https://dev.to/morinaga/how-i-built-a-youtube-performance-classifier-that-adjusts-tomorrows-video-script-bias-19ba

ঐচ্ছিক লার্নিং কমিউনিটি: https://t.me/GyaanSetuAi