Google, Amazon, Apple Microsoft et IBM ainsi que leur technologie de reconnaissance vocale sont sur le banc des accusés. Selon des chercheurs et comme le rapporte le New York Times, la technologie utilisée par les géants du numérique aurait mal identifié 35% des mots dits par des personnes de couleurs.

Les systèmes de reconnaissance vocale reconnaissent-ils certaines voix mieux que d’autres ?

Aujourd’hui, l’usage de la reconnaissance vocale est devenu courant. “Ok Google”, “Dis Siri”, chaque marque a son nom de code pour déclencher la technologie. Il semblerait cependant que chacun de ces outils ne soit pas totalement performant. Si les systèmes de reconnaissance vocale proposés par Apple, Amazon, Microsoft, IBM et Google font très peu d’erreurs lorsqu’il s’agit de comprendre les mots dits par des personnes blanches, lorsque ces personnes sont de couleurs, le taux d’erreurs et bien plus important.

Dans l’étude publiée initialement par la revue Proceedings of the National Academy of Sciences, il est montré que les technologies ont qualifié d’incompréhensible seulement 2% des extraits audio de personnes blanches, et cela s’est multiplié par 10 pour atteindre 20% dans le cadre d’audio de personnes noires.

L’étude montre donc que les systèmes de reconnaissances vocales évoluent vite, mais ne sont pas assez testés, ni modifiés pour prendre en compte ces points faibles.

La raison serait-elle un manque de tests et d’exercices ?

Plus généralement, des études sur le sujet montrent que la reconnaissance vocale, en plus d’être raciste, serait également sexiste. Elle serait moins précise lorsqu’une femme parle, pour dire la même chose qu’un homme. Réagissant à cela, Ravi Shroff, professeur de statistique à l’Université de New York dit ne pas comprendre “pourquoi il n’y a pas plus de diligence raisonnable de la part de ces entreprises avant la publication de ces technologies.” Il dit également ne pas comprendre pourquoi ces problèmes de racisme et de sexisme persistent.

L’une des explications au racisme et sexisme de la reconnaissance vocale avancée par l’étude de Stanford serait que les systèmes de reconnaissance vocale seraient défectueux et pas assez testés par les entreprises qui les créent. Celles-ci entraîneraient les technologies sur des bases de données manquant de diversité.

Pour John John Rickford de l’Université de Stanford, qui est chercheur spécialisé dans le discours afro-américain, “les cinq entreprises qui font de la reconnaissance vocale font toutes le même genre d’erreur”. Pour lui, les technologies sont trop entraînées sur des voix d’hommes blancs.

Du côté des cinq géants de la technologie, Apple et Microsoft ont refusé de commenter l’étude. IBM n’a pas répondu aux sollicitations du New York Times, Google, lui, nous aide déjà à prononcer les mots difficiles, il a cependant admis travailler sur ce point qu’il considère être “un défi”. Et enfin, Amazon, par le biais d’une porte-parole a redirigé le média vers une page sur laquelle l’entreprise assure améliorer en permanence sa technologie et ses services de reconnaissance vocale.