Google AI présente Translatotron : un outil permettant de traduire la voix
Intelligence ArtificielleOUTILS

Google AI présente Translatotron : un outil permettant de traduire la voix

Deepl avait déjà mis au placard Google Traduction et Reverso, mais Translatotron pourrait encore aller plus loin dans la traduction.

Fini la voix robotique de Google Traduction, des chercheurs de chez Google AI ont réussi à développer une intelligence artificielle capable de traduire les paroles d’un orateur, tout en gardant l’intonation originale. Pour le moment, les résultats ne sont pas parfaits, cependant les premiers essais sont plutôt prometteurs.

Contrairement aux traducteurs numériques habituels, ce programme convertit directement l’entrée audio en sortie audio, sans aucune étape intermédiaire. Google Traduction, par exemple, traduit d’abord l’audio en texte, puis traduit le texte, pour ensuite le prononcer à l’oral avec une voix tout sauf naturelle.

Pour mieux comprendre, faisons un test. Le premier enregistrement est un extrait d’espagnol.

Voici maintenant sa traduction en anglais avec un traducteur de type Google Traduction, ou Reverso.

Le dernier extrait est toujours la traduction du premier, néanmoins elle est cette fois-ci réalisée par Translatotron, le nouveau programme développé par Google AI.

Google AI avait précisément expliqué le fonctionnement de Translatotron, le mois dernier sur ArXiv. Pour faire simple, Translatotron est composé de trois éléments en charge de produire une traduction parfaite. Le premier composant utilise un réseau neuronal afin d’associer le spectrogramme audio dans sa langue d’origine au spectrogramme audio dans la langue de sortie. Ensuite, le deuxième composant convertit le spectrogramme en une onde audio. Pour finir, le troisième composant permet de finaliser l’intonation de la voix en superposant les caractéristiques vocales d’origine avec la version finale. Ce programme en trois devrait minimiser les erreurs de traduction, par rapport aux autres services qui utilisent bien plus d’étapes.

Les premiers essais n’ont testé que la traduction de l’anglais vers l’espagnol, et selon les informations de l’équipe de recherche, cela a déjà nécessité un grand nombre de données pour former correctement cette IA. Toutefois il est important de noter que les premiers clips audio sont plutôt prometteurs en vue d’un éventuel service grand public.

Send this to a friend