Xây dựng Quy trình Sản xuất Video với 2 Người dẫn chương trình bằng AI
Tôi muốn vượt ra khỏi khuôn khổ của những video dạng dọc ngắn ngủi.
Nội dung dài hơn cần một định dạng tốt hơn. Một giọng nói robot duy nhất đọc một danh sách sẽ rất nhàm chán. Người xem sẽ ngừng theo dõi.
Tôi đã xây dựng một hệ thống để tạo ra các video dài 10 phút với hai người dẫn chương trình. Họ trò chuyện, tranh luận và chuyển giao chủ đề một cách tự nhiên. Nhịp điệu này giúp giữ chân người xem.
Tôi đã xây dựng hệ thống này từ đầu để hoạt động bên trong GitHub Actions. Nó phải chạy tự động mỗi khi tôi cập nhật một tệp.
Dưới đây là cách hệ thống hoạt động:
• Mọi thứ đều bắt đầu với một tệp JSON duy nhất. • Tệp này chứa kịch bản, người nói và dữ liệu slide. • Tôi sử dụng edge-tts để tạo âm thanh. Nó miễn phí và không yêu cầu API keys. • Tôi sử dụng Pillow để chuyển đổi dữ liệu JSON thành hình ảnh slide. • Tôi sử dụng ffmpeg để ghép âm thanh và hình ảnh thành một video.
Các lựa chọn kỹ thuật chính:
- Hai giọng nói: Tôi gán Người nói A với một giọng và Người nói B với một giọng khác. Tôi giữ các câu dưới 25 từ. Điều này giúp AI nghe giống người thật hơn.
- Không dùng trình duyệt: Tôi không sử dụng Playwright hay Chrome để tạo slide. Việc đó mất quá nhiều thời gian trong một CI pipeline. Pillow nhanh hơn nhiều trong việc render hình ảnh.
- Xử lý lỗi thông minh: Tôi kiểm tra kích thước tệp của mỗi đoạn âm thanh. Đôi khi API trả về một tệp trống. Script của tôi sẽ phát hiện lỗi này trước khi video bị lỗi.
- Render nhanh: Một video 10 phút mất khoảng 5 phút để render trong GitHub Actions. Phần lớn thời gian đó là để chờ đợi audio API.
Quy trình làm việc rất đơn giản:
- Tôi push một tệp JSON vào một thư mục cụ thể.
- GitHub Actions kích hoạt quá trình render.
- Hệ thống tải video lên YouTube thông qua API.
- Tệp được chuyển vào thư mục 'uploaded'.
Thiết lập này cho phép tôi sản xuất nội dung giáo dục dạng dài mà không cần chỉnh sửa thủ công. Nó tự động biến một kịch bản thành một video hoàn chỉnh.
Cộng đồng học tập tùy chọn: https://t.me/GyaanSetuAi
