𝗜 𝗕𝘂𝗶𝗹𝘁 𝗟𝗶𝘃𝗲 𝗖𝗮𝗽𝘁𝗶𝗼𝗻𝘀 𝗶𝗻 𝘁𝗵𝗲 𝗕𝗿𝗼𝘄𝘀𝗲𝗿

📅3 hours ago⏱1 min read

J'ai créé des sous-titres en direct dans le navigateur

Pas besoin de Whisper. Pas besoin de clé API. Pas besoin de serveur.

Chrome et Edge incluent un moteur de reconnaissance vocale intégré. J'ai créé des sous-titres en direct avec ce moteur en seulement 30 lignes de code.

Essayez-le ici : https://dev48v.infy.uk/solve/day8-live-captions.html

Le code utilise l'API SpeechRecognition.

Deux paramètres font la différence entre une simple boîte de dictée et de véritables sous-titres en direct :

continuous = true : cela permet au moteur de rester à l'écoute.
interimResults = true : cela affiche vos mots pendant que vous parlez.

Sans eux, le moteur n'affiche le texte qu'après une pause. Avec eux, vous voyez les prédictions en temps réel. Cela crée cet effet de scintillement des sous-titres.

Le moteur s'arrête s'il détecte un silence trop long. On résout ce problème en le redémarrant lors de l'événement onend. Cette boucle permet de maintenir les sous-titres actifs malgré les pauses et les moments de silence.

Chrome transmet l'audio aux serveurs de Google pour ce processus. Cela signifie qu'une connexion Internet est nécessaire.

Vous pouvez utiliser cela pour plus qu'un simple microphone. Vous pouvez capturer l'audio d'un appel vidéo ou d'un onglet YouTube. Utilisez getDisplayMedia pour récupérer l'audio et l'envoyer au transcripteur.

Le navigateur possède de nombreuses fonctionnalités inutilisées. Les sous-titres en direct et les commandes vocales sont accessibles avec une seule ligne de code. Vous n'avez pas besoin de backend.

Source : https://dev.to/dev48v/i-built-live-captions-in-the-browser-no-api-key-no-server-4i7n

𝗜 𝗕𝘂𝗶𝗹𝘁 𝗟𝗶𝘃𝗲 𝗖𝗮𝗽𝘁𝗶𝗼𝗻𝘀 𝗶𝗻 𝘁𝗵𝗲 𝗕𝗿𝗼𝘄𝘀𝗲𝗿

Continue reading

𝗜 𝗕𝘂𝗶𝗹𝘁 𝗔𝗻 𝗔𝗜 𝗧𝗼𝗼𝗹 𝗧𝗼 𝗧𝗲𝘀𝘁 𝗪𝗲𝗯 𝗙𝗼𝗿𝗺𝘀

𝗖𝗵𝗮𝗿𝗮𝗰𝘁𝗲𝗿 𝗖𝗼𝘂𝗻𝘁𝗲𝗿 𝗪𝗲𝗯 𝗔𝗽𝗽

Le problème d'authentification WebSocket : Cookies vs Bearer Tokens

𝗪𝗲𝗯𝗦𝗼𝗰𝗸𝗲𝘁 𝗔𝘂𝘁𝗵: 𝗖𝗼𝗼𝗸𝗶𝗲𝘀 𝘃𝘀 𝗕𝗲𝗮𝗿𝗲𝗿 𝗧𝗼𝗸𝗲𝗻𝘀

Comment JavaScript s'exécute dans le navigateur