ನಾನು ಹೇಗೆ ಒಂದು YouTube ಫೀಡ್‌ಬ್ಯಾಕ್ ಲೂಪ್ ಅನ್ನು ನಿರ್ಮಿಸಿದೆ

ನಾನು ಒಂದು ಸ್ವಯಂಚಾಲಿತ (automated) YouTube ಚಾನಲ್ ಅನ್ನು ನಡೆಸುತ್ತಿದ್ದೇನೆ. ಪ್ರತಿದಿನ, ಒಂದು ಪೈಪ್‌ಲೈನ್ ಸ್ಕ್ರಿಪ್ಟ್‌ಗಳನ್ನು ಸಿದ್ಧಪಡಿಸುತ್ತದೆ ಮತ್ತು ವೀಡಿಯೊಗಳನ್ನು ರೆಂಡರ್ ಮಾಡುತ್ತದೆ.

ತಿಂಗಳುಗಟ್ಟಲೆ, ಈ ವ್ಯವಸ್ಥೆಯು ಯಾವುದೇ ಮಾಹಿತಿ ಇಲ್ಲದೆ ಕೆಲಸ ಮಾಡುತ್ತಿತ್ತು. ಯಾವುದು ಯಶಸ್ವಿಯಾಯಿತು ಅಥವಾ ಯಾವುದು ವಿಫಲವಾಯಿತು ಎಂಬ ಅರಿವಿಲ್ಲದೆ ಸ್ಕ್ರಿಪ್ಟ್ ಜನರೇಟರ್ ವಿಷಯಗಳನ್ನು ಸಿದ್ಧಪಡಿಸುತ್ತಿತ್ತು. ನನ್ನ ಬಳಿ ಯಾವುದೇ ಫೀಡ್‌ಬ್ಯಾಕ್ ಲೂಪ್ ಇರಲಿಲ್ಲ.

ಕಳೆದ ವಾರ, ನಾನು 330 ಸಾಲುಗಳ Python ಸ್ಕ್ರಿಪ್ಟ್ ಮೂಲಕ ಇದನ್ನು ಸರಿಪಡಿಸಿದೆ. ಇದು ಕಾರ್ಯಕ್ಷಮತೆ (performance) ಮತ್ತು ಸೃಷ್ಟಿಯ (creation) ನಡುವೆ ಒಂದು ಮುಚ್ಚಿದ ಲೂಪ್ ಅನ್ನು ಸೃಷ್ಟಿಸುತ್ತದೆ.

ಇದು ಹೇಗೆ ಕೆಲಸ ಮಾಡುತ್ತದೆ ಎಂಬುದು ಇಲ್ಲಿದೆ:

• ಡೇಟಾ ಸಂಗ್ರಹಣೆ (Data Collection): ಈ ಸ್ಕ್ರಿಪ್ಟ್ ಕೊನೆಯ 30 ವೀಡಿಯೊಗಳನ್ನು ಓದಲು YouTube Data API v3 ಅನ್ನು ಬಳಸುತ್ತದೆ. • ವರ್ಗೀಕರಣ (Classification): ವೀಡಿಯೊಗಳನ್ನು ಶ್ರೇಣೀಕರಿಸಲು ಇದು ಮೀಡಿಯನ್-ಆಧಾರಿತ (median-based) ಮಿತಿಯನ್ನು ಬಳಸುತ್ತದೆ.

  • HIGH: ಮೀಡಿಯನ್‌ನ 1.5x ಗಿಂತ ಹೆಚ್ಚಿನ ವೀಕ್ಷಣೆಗಳನ್ನು ಹೊಂದಿರುವ ವೀಡಿಯೊಗಳು.
  • LOW: ಮೀಡಿಯನ್‌ನ 0.6x ಗಿಂತ ಕಡಿಮೆ ವೀಕ್ಷಣೆಗಳನ್ನು ಹೊಂದಿರುವ ವೀಡಿಯೊಗಳು (ಅವುಗಳು 72 ಗಂಟೆಗಳಿಗಿಂತ ಹಳೆಯದಾಗಿದ್ದರೆ ಮಾತ್ರ).
  • ಗೊಂದಲವನ್ನು ತಪ್ಪಿಸಲು ಉಳಿದವುಗಳನ್ನು ನಿರ್ಲಕ್ಷಿಸಲಾಗುತ್ತದೆ. • ಪ್ಯಾಟರ್ನ್ ಮ್ಯಾಚಿಂಗ್ (Pattern Matching): ಶೀರ್ಷಿಕೆಯ ಪದಗಳನ್ನು ಹೊಂದಿಸುವ ಮೂಲಕ, ಸ್ಕ್ರಿಪ್ಟ್ ಕಾರ್ಯಕ್ಷಮತೆಯನ್ನು ಟ್ಯುಟೋರಿಯಲ್ ಅಥವಾ ಹೋಲಿಕೆಗಳಂತಹ "ಆರ್ಕಿಟೈಪ್‌ಗಳಿಗೆ" (archetypes) ಜೋಡಿಸುತ್ತದೆ. • ಹುಕ್ ವಿಶ್ಲೇಷಣೆ (Hook Analysis): ಸ್ಕ್ರಿಪ್ಟ್‌ನ ಮೊದಲ ಪದವು ಪ್ರಶ್ನೆಯೇ, ಸಂಖ್ಯೆಯೇ ಅಥವಾ ವೈಯಕ್ತಿಕ ಹೇಳಿಕೆಯೇ ಎಂದು ಇದು ಪರಿಶೀಲಿಸುತ್ತದೆ. • ಸ್ವಯಂಚಾಲಿತ ಅಪ್‌ಡೇಟ್‌ಗಳು (Automated Updates): ಫಲಿತಾಂಶಗಳು ಮಾರ್ಕ್‌ಡೌನ್ (markdown) ಫೈಲ್‌ಗೆ "ಬಯಾಸ್ ಹಿಂಟ್ಸ್" (bias hints) ಅನ್ನು ಬರೆಯುತ್ತವೆ.

ಸ್ಕ್ರಿಪ್ಟ್ ಜನರೇಟರ್ ಮುಂದಿನ ಸ್ಕ್ರಿಪ್ಟ್ ಬರೆಯುವ ಮೊದಲು ಈ ಫೈಲ್ ಅನ್ನು ಓದುತ್ತದೆ. ಯಾವ ಮಾದರಿಗಳು (patterns) ಯಶಸ್ವಿಯಾಗುತ್ತಿವೆ ಮತ್ತು ಯಾವುವು ವಿಫಲವಾಗುತ್ತಿವೆ ಎಂಬುದನ್ನು ಅದು ನೋಡುತ್ತದೆ. ನಾಳೆಯ ಉತ್ತಮ ನಿರ್ಧಾರಗಳನ್ನು ತೆಗೆದುಕೊಳ್ಳಲು ಇದು ಈ ಸಂದರ್ಭವನ್ನು (context) ಬಳಸಿಕೊಳ್ಳುತ್ತದೆ.

ನಾನು ಈ ವಿಧಾನವನ್ನು ಏಕೆ ಆರಿಸಿಕೊಂಡೆ:

  • ಮೀನ್ (Mean) ಗಿಂತ ಮೀಡಿಯನ್ (Median) ಉತ್ತಮ: ಒಂದು ವೈರಲ್ ವೀಡಿಯೊ ಸರಾಸರಿ (mean average) ಅನ್ನು ಹಾಳುಮಾಡಬಹುದು. ಆದರೆ ಮೀಡಿಯನ್ ಸ್ಥಿರವಾಗಿರುತ್ತದೆ.
  • 72-ಗಂಟೆಗಳ ನಿಯಮ: ಹೊಸ ವೀಡಿಯೊಗಳಿಗೆ ಸಮಯ ಬೇಕು. ಕೇವಲ ಒಂದು ದಿನದಷ್ಟು ಹಳೆಯದಾಗಿದೆ ಎಂಬ ಕಾರಣಕ್ಕೆ ನಾನು ವೀಡಿಯೊವನ್ನು ವಿಫಲ ಎಂದು ಲೇಬಲ್ ಮಾಡುವುದಿಲ್ಲ.
  • ಸರಳ ಹ್ಯೂರಿಸ್ಟಿಕ್ಸ್ (Simple Heuristics): ನಾನು ಸದ್ಯಕ್ಕೆ ದುಬಾರಿ LLM ಕರೆಗಳ ಬದಲಿಗೆ ಮೊದಲ ಪದದ ಪತ್ತೆಹಚ್ಚುವಿಕೆಯನ್ನು (first-word detection) ಬಳಸುತ್ತಿದ್ದೇನೆ. ಇದು ವೇಗವಾಗಿದೆ ಮತ್ತು ಅಗ್ಗವಾಗಿದೆ.

ಇದು ಮಾಟವಲ್ಲ. ಇದು ತನ್ನದೇ ಆದ ಡೇಟಾದಿಂದ ಕಲಿಯುವ ಒಂದು ವ್ಯವಸ್ಥೆ.

ಗುರಿ ಮಾನವ ನಿರ್ಧಾರವನ್ನು ಬದಲಾಯಿಸುವುದಲ್ಲ, ಬದಲಾಗಿ ಜನರೇಟರ್‌ಗೆ ಉತ್ತಮ ಸಂದರ್ಭವನ್ನು (context) ಒದಗಿಸುವುದು. ನಾನು ಪ್ರತಿ 24 ಗಂಟೆ마다 ಹೆಚ್ಚು ಬುದ್ಧಿವಂತವಾಗುವ ವ್ಯವಸ್ಥೆಯನ್ನು ನಿರ್ಮಿಸುತ್ತಿದ್ದೇನೆ.

ಮೂಲ (Source): https://dev.to/morinaga/how-i-built-a-youtube-performance-classifier-that-adjusts-tomorrows-video-script-bias-19ba

ಐಚ್ಛಿಕ ಕಲಿಕಾ ಸಮುದಾಯ (Optional learning community): https://t.me/GyaanSetuAi