Tarayıcıda Canlı Altyazı Oluşturdum
Whisper'a ihtiyacınız yok. Bir API anahtarına ihtiyacınız yok. Bir sunucuya ihtiyacınız yok.
Chrome ve Edge, yerleşik bir sesten metne dönüştürme (speech-to-text) motoru içerir. Bununla, sadece 30 satır kod kullanarak canlı altyazılar oluşturdum.
Burada deneyin: https://dev48v.infy.uk/solve/day8-live-captions.html
Kod, SpeechRecognition API'sini kullanıyor.
İki ayar, basit bir dikte kutusu ile gerçek canlı altyazılar arasındaki farkı yaratıyor:
- continuous = true: Bu, motorun dinlemeye devam etmesini sağlar.
- interimResults = true: Bu, konuşurken kelimelerinizi gösterir.
Bunlar olmadan motor, metni yalnızca durakladığınızda gösterir. Bunlarla birlikte, tahminleri gerçek zamanlı olarak görürsünüz. Bu da o titreyen altyazı efektini oluşturur.
Motor, çok uzun süre sessizlik duyarsa durur. Bunu, onend event'inde motoru yeniden başlatarak çözebilirsiniz. Bu döngü, duraklamalar ve sessiz anlar boyunca altyazıların çalışmaya devam etmesini sağlar.
Chrome, bu işlem için sesi Google sunucularına aktarır. Bu da bir internet bağlantısına ihtiyacınız olduğu anlamına gelir.
Bunu bir mikrofondan daha fazlası için kullanabilirsiniz. Bir görüntülü aramadan veya bir YouTube sekmesinden ses yakalayabilirsiniz. Sesi almak ve yazıya dökücüye iletmek için getDisplayMedia kullanın.
Tarayıcının birçok kullanılmayan özelliği var. Canlı altyazılar ve sesli komutlar tek bir satır kodla kullanılabilir. Bir backend'e ihtiyacınız yok.
Kaynak: https://dev.to/dev48v/i-built-live-captions-in-the-browser-no-api-key-no-server-4i7n