YouTube ಎಡಿಟರ್‌ಗಳಿಗಾಗಿ AI ಆಟೊಮೇಷನ್

ಒಂದು YouTube ವೀಡಿಯೊವನ್ನು ಆಕರ್ಷಕವಾಗಿಸುವ ಕೆಲವು ಸೆಕೆಂಡುಗಳನ್ನು ಹುಡುಕಲು ಗಂಟೆಗಟ್ಟಲೆ ಇರುವ ರೊ (raw) ಫೂಟೇಜ್ ಅನ್ನು ಹುಡುಕುವುದು ದಣಿವಿನ ಕೆಲಸವಾಗಿದೆ. ಸ್ವತಂತ್ರ ಎಡಿಟರ್‌ಗಳು ಯಾವ ಕ್ಷಣಗಳು ವೀಕ್ಷಕರನ್ನು ಸೆಳೆಯುತ್ತವೆ ಎಂದು ಊಹಿಸುವಲ್ಲಿ ಸಮಯ ವ್ಯರ್ಥ ಮಾಡುತ್ತಾರೆ. ಇದು ಅಸಮತೋಲಿತ ವೇಗ ಮತ್ತು ಅವಕಾಶಗಳನ್ನು ಕಳೆದುಕೊಳ್ಳಲು ಕಾರಣವಾಗುತ್ತದೆ. AI ಈ ಊಹಾಪೋಹೆಯನ್ನು ಪುನರಾವರ್ತಿತ ಪ್ರಕ್ರಿಯೆಯನ್ನಾಗಿ ಪರಿವರ್ತಿಸುತ್ತದೆ.

ಮೂರು-ಪದರಗಳ ಚೌಕಟ್ಟು

ಹೈಲೈಟ್ ಆಯ್ಕೆಯನ್ನು ಆಟೊಮೇಟ್ ಮಾಡಲು ಅತ್ಯಂತ ವಿಶ್ವಾಸಾರ್ಹ ಮಾರ್ಗವೆಂದರೆ ಮೂರು-ಪದರಗಳ ಪೈಪ್‌ಲೈನ್ ಬಳಸುವುದು.

  • ಪದರ 1 (Layer 1) ಒಂದು ವಿಶಾಲವಾದ ಜಾಲವಾಗಿದೆ. ಇದು ಆಡಿಯೋ ಸ್ಪೈಕ್‌ಗಳು (audio spikes) ಮತ್ತು ವೇಗದ ಮಾತುಗಳಂತಹ ಕಡಿಮೆ ವೆಚ್ಚದ ಸಂಕೇತಗಳನ್ನು ಬಳಸಿ ಮೂಲ ಮಟ್ಟದಿಂದ (baseline) ಭಿನ್ನವಾಗಿರುವ ಭಾಗಗಳನ್ನು ಗುರುತಿಸುತ್ತದೆ.
  • ಪದರ 2 (Layer 2) ಒಂದು ನಿಖರವಾದ ಹೂಕ್ ಆಗಿದೆ. ಇದು ಟ್ರಾನ್ಸ್‌ಕ್ರಿಪ್ಟ್ ಅನ್ನು ವಿಶ್ಲೇಷಿಸುವ ಮೂಲಕ ಆ ಗುರುತುಗಳನ್ನು ಸುಧಾರಿಸುತ್ತದೆ. ಇದು ಅನೇಕ ಹೆಚ್ಚಿನ ವಿಶ್ವಾಸಾರ್ಹ ಸೂಚನೆಗಳನ್ನು ಒಳಗೊಂಡಿರುವ ಕ್ಷಣಗಳನ್ನು ಉಳಿಸಿಕೊಳ್ಳಲು ಸೆಂಟಿಮೆಂಟ್ ಅನಾಲಿಸಿಸ್ (sentiment analysis) ಮತ್ತು ಮುಖಭಾವದ ಸ್ಕೋರಿಂಗ್ ಅನ್ನು ಬಳಸುತ್ತದೆ.
  • ಪದರ 3 (Layer 3) ಮಾನವ-AI ವಿಮರ್ಶೆಯಾಗಿದೆ. ಎಡಿಟರ್ ಆ ಅನುಕ್ರಮವನ್ನು ಪರಿಶೀಲಿಸುತ್ತಾರೆ ಮತ್ತು ಬಾಗಿಲು ಮುಚ್ಚುವ ಶಬ್ದ ಅಥವಾ ಕೆಮ್ಮಿನಂತಹ ತಪ್ಪು ಪಾಸಿಟಿವ್‌ಗಳನ್ನು (false positives) ತೆಗೆದುಹಾಕುತ್ತಾರೆ. ಇದು ಕ್ಲಿಪ್‌ಗಳು ಒಂದು ಕಥೆಯನ್ನು ಹೇಳುವಂತೆ ಮಾಡುತ್ತದೆ.

Azure Face API ಇದಕ್ಕಾಗಿ ನೀವು ಬಳಸಬಹುದಾದ ಒಂದು ಸಾಧನವಾಗಿದೆ. ಇದು ಆಶ್ಚರ್ಯ, ಸಂತೋಷ ಅಥವಾ ಏಕಾಗ್ರತೆಯನ್ನು ಅಳೆಯಲು ಮುಖಭಾವದ ಪತ್ತೆಹಚ್ಚುವಿಕೆಯನ್ನು (facial expression detection) ಒದಗಿಸುತ್ತದೆ.

ಒಂದು ಆಶ್ಚರ್ಯಕರ ವಿಷಯ ತಿಳಿಸಿದ ನಂತರ ನಿರೂಪಕರು ನಗುವ ಎರಡು ಗಂಟೆಯ ಪಾಡ್‌ಕಾಸ್ಟ್ ಅನ್ನು ಎಡಿಟ್ ಮಾಡುತ್ತಿದ್ದೀರಿ ಎಂದು ಕಲ್ಪಿಸಿಕೊಳ್ಳಿ. ಪದರ 1 ಆಡಿಯೋ ಸ್ಪೈಕ್ ಅನ್ನು ಪತ್ತೆಹಚ್ಚುತ್ತದೆ. ಪದರ 2 ಟ್ರಾನ್ಸ್‌ಕ್ರಿಪ್ಟ್‌ನಲ್ಲಿ ನಗು ಮತ್ತು Azure Face API ನಿಂದ ಸಂತೋಷದ ಸ್ಕೋರ್ ಏರಿಕೆಯನ್ನು ಗುರುತಿಸುತ್ತದೆ. ನೀವು ಅದನ್ನು ಟೈಮ್‌ಲೈನ್‌ನಲ್ಲಿ ಇರಿಸುವ ಮೊದಲು, ಪದರ 3 ಆ ಕ್ಲಿಪ್ ಒಂದು ಪಂಚ್‌ಲೈನ್ ಆಗಿ ಕೆಲಸ ಮಾಡುತ್ತದೆ ಎಂದು ಖಚಿತಪಡಿಸುತ್ತದೆ.

ಅನುಷ್ಠಾನದ ಹಂತಗಳು

  • ರೊ (raw) ಫೈಲ್ ಮೇಲೆ ವೇಗದ ಆಡಿಯೋ ಮತ್ತು ಸ್ಪೀಚ್ ಪಾಸ್ ಅನ್ನು ರನ್ ಮಾಡಿ. ಶಬ್ದದ ಮಟ್ಟ ಅಥವಾ ಪ್ರತಿ ನಿಮಿಷದ ಪದಗಳ ಸಂಖ್ಯೆ 20 ಪ್ರತಿಶತಕ್ಕಿಂತ ಹೆಚ್ಚು ಏರಿಕೆಯಾಗುವ ಯಾವುದೇ ಭಾಗಕ್ಕೆ ಮಾರ್ಕರ್‌ಗಳನ್ನು ರಚಿಸಿ.

  • ಗುರುತಿಸಲಾದ ಭಾಗಗಳನ್ನು ಟ್ರಾನ್ಸ್‌ಕ್ರಿಪ್ಶನ್ ಸೇವೆಗೆ ನೀಡಿ. ಸೆಂಟಿಮೆಂಟ್ ಸ್ಕೋರಿಂಗ್ ಅನ್ನು ರನ್ ಮಾಡಿ ಮತ್ತು ಟ್ರಿಗ್ಗರ್ ಪದಗಳಿಗಾಗಿ ಹುಡುಕಿ. ಕನಿಷ್ಠ ಎರಡು ಸಂಕೇತಗಳು ಹೊಂದಿಕೆಯಾಗುವ ಭಾಗಗಳನ್ನು ಮಾತ್ರ ಉಳಿಸಿಕೊಳ್ಳಲು ಮುಖಭಾವದ ಸ್ಕೋರಿಂಗ್ ಬಳಸಿ.

  • ಮಾರ್ಕರ್‌ಗಳನ್ನು ನಿಮ್ಮ ಎಡಿಟಿಂಗ್ ಸಾಫ್ಟ್‌ವೇರ್‌ಗೆ ಇಂಪೋರ್ಟ್ ಮಾಡಿ. ತಪ್ಪು ಪಾಸಿಟಿವ್‌ಗಳನ್ನು ತೆಗೆದುಹಾಕಲು ಅವುಗಳನ್ನು ಒಂದರ ನಂತರ ಒಂದರಂತೆ ನೋಡಿ. ಉಳಿದ ಭಾಗಗಳು ಒಂದು ಸುಸಂಬದ್ಧ ಕಥೆಯ ಲಯವನ್ನು ರೂಪಿಸುವುದನ್ನು ಖಚಿತಪಡಿಸಿಕೊಳ್ಳಲು ಅವುಗಳನ್ನು ಜೋಡಿಸಿ.

ಪದರಗಳ ವಿಧಾನವು ಅಸ್ಪಷ್ಟ ಪತ್ತೆಹಚ್ಚುವಿಕೆಯನ್ನು ನಿಖರವಾದ ಆಯ್ಕೆಯಿಂದ ಪ್ರತ್ಯೇಕಿಸುತ್ತದೆ. ಆಡಿಯೋ ಸ್ಪೈಕ್‌ಗಳು, ಮಾತಿನ ವೇಗ, ಸೆಂಟಿಮೆಂಟ್ ಪೀಕ್ಸ್ ಮತ್ತು ಮುಖಭಾವದ ಸ್ಕೋರ್‌ಗಳನ್ನು ಸಂಯೋಜಿಸುವುದು ಹೆಚ್ಚಿನ ವಿಶ್ವಾಸಾರ್ಹ ಹೈಲೈಟ್‌ಗಳನ್ನು ನೀಡುತ್ತದೆ