La société Nuance, adepte des nouvelles technologies, fait état de son dernier système biométrique de reconnaissance vocale, Nuance Gatekeeper, présenté comme « la solution la plus avancée à ce jour pour authentifier les utilisateurs et lutter contre la fraude ». Si beaucoup investissent dans la reconnaissance faciale, généralement considérée comme la biométrie la plus fiable, la reconnaissance vocale semble toutefois avoir quelques avantages.

Un outil servi par les algorithmes

Nuance Gatekeeper utilise la biométrie et l’IA conversationnelle pour authentifier les clients, et mieux détecter la fraude sur des canaux vocaux. Pour ce faire, le système s’appuie sur des caractéristiques spécifiques et des traits propres à chaque individu.

L’entreprise insiste sur l’intensification des cas de fuites de données : type mots de passe et identifiants d’une part, et sur le piratage de ces données d’autre part. Ces cas rendent l’identification par la « connaissance » obsolète : « La biométrie permet de protéger les individus en se basant sur qui ils sont plutôt que sur ce qu’ils savent. Les données sous forme de modèles biométriques sont bien moins exploitables que des mots de passe lorsqu’elles sont hackées, en ceci qu’elles sont quasiment impossibles à répliquer », déclare Dan Miller, Analyste-en-chef chez Opus Research.

L’entreprise positionne ses atouts à partir de différents éléments techniques, tous garants, selon ses experts, de performance et d’efficacité. Le produit dispose d’une plateforme cloud-native qui accélère les déploiements cloud sur le site de l’entreprise cliente. Son moteur de biométrie vocale, optimisé par l’IA peut authentifier un client, et commencer à personnaliser l’interaction, en moins d’une demi seconde.

« Les entreprises de toute taille font leur maximum pour devancer les fraudeurs et contrer les nouvelles méthodes d’usurpation d’identité grâce à des imitations de synthèse. Les entreprises préfèrent les modèles de sécurité cloud-native, car ils sont accessibles, évolutifs et offrent l’accès à des mises à jour en temps réel des derniers algorithmes de lutte contre la fraude.», précise Nuance.

L’entreprise, basée aux États-Unis, active dans le domaine de l’intelligence artificielle depuis les années 90, et reconnue comme le leader sur le marché par le cabinet d’expertise Opus research, comprend une équipe de 300 chercheurs. Parmi eux, un groupe développe les algorithmes d’intelligence artificielle qui peuvent être utilisés pour la détection des voix naturelles ou artificielles, et la biométrie vocale. Une équipe de 86 personnes est chargée d’appliquer ces algorithmes à la biométrie vocale pure, et notamment d’entrainer ces algorithmes (machine learning) avec des données audio, pour reconnaitre les éventuelles anomalies au moment de l’authentification. Les clients de l’entreprise sont entre autres, des grands groupes financiers et des agences de télécommunications.

Dans le cadre du lancement de Nuance Gatepeeker, Brett Beranek, expert en biométrie au sein de la société Nuance, a bien voulu répondre aux questions de Siècle Digital.

Comment fonctionne votre produit ?
« La biométrie vocale utilise les caractéristiques physiques et comportementales liées à la voix, et sont analysées tandis qu’une personne est en train de parler, que ce soit sous une application mobile, en entretient téléphonique, ou même dans une succursale bancaire par exemple. Si les critères de l’analyse correspondent avec les données vocales préalablement récupérées, on considère que l’authentification est réussie, et nous sommes en mesure de confirmer l’identité de l’interlocuteur. »

Au-delà du principe d’authentification, un produit comme Nuance Gatepeeker peut prévenir ses clients en cas de fraude, et l’expert ajoute que : « De façon très similaire, nous sommes aussi en mesure de détecter les fraudeurs, d’une part, voire de reconnaitre l’identité du fraudeur, notre société étant régulièrement en contact avec les forces de l’ordre dans le cadre de prévention des fraudes. »

Combien de temps faut-il à votre système pour reconnaitre l’identité d’une personne, y a-t-il une moyenne de durée ?
« Si on demande à l’individu de prononcer une phrase spécifique, on est en mesure de reconnaitre l’individu avec très peu de données. Nous avons des systèmes qui utilisent deux ou trois mots pour identifier les individus. Par exemple dans l’accès à des applications, ou des systèmes d’activation dans les entreprises. Dans le cas d’une discussion ouverte, dans laquelle on ne connait pas au préalable les mots qui seront utilisés par l’interlocuteur, on a besoin d’environ 3 secondes audio pour être en mesure d’identifier la personne. ».

Le timbre de voix d’une personne peut-il être imité, et par conséquent tromper votre système de biométrie vocale ?
« Ce qu’il faut bien comprendre, c’est que la voix fait en réalité appel à plusieurs caractéristiques, et les imitateurs ne sont pas en mesure de toutes les imiter. Si les caractéristiques comportementales peuvent être plus ou bien moins imitées, les caractéristiques physiques, elles, sont propres à notre corps, comme la taille du larynx, mais également tous les organes avec lesquels la voix entre en contact, exemple la partie buccale, les dents, etc. Tous ces éléments ont un effet direct sur la particularité de notre, et sont, eux, impossibles à imiter. D’autre part, la voix n’est pas statique, il y a une variation normale dans ces caractéristiques, c’est d’ailleurs sa particularité en tant que biométrie, son objet est variable, en fonction du moment de la journée par exemple, mais également avec l’âge notamment. le nombre de caractéristiques tourne autour de 1000, et plusieurs d’entre elles subiront différentes variations. Le système est donc programmé pour discerner les variations normales, et les éventuelles anomalies qui pourraient empêcher la validation de l’authentification d’un individu alors non reconnu.»

Cette précision pose en effet une autre question, êtes-vous en mesure d’anticiper le vieillissement de la voix, ou demandez-vous aux clients de renouveler les enregistrements servant à l’authentification ?
« Pour les adultes, les algorithmes sont en mesure d’anticiper les variations normales dues à la maturité d’une voix. Des tests ont notamment été conduits sur des enregistrements d’acteurs connus pris à différents moments de leur vie, afin d’établir ces algorithmes. Pour les enfants, c’est plus compliqué, mais les clients sujets à ce type d’authentification sont en réalité des personnes majeures, et donc la problématique ne se pose pas

D’un point de vue général, la biométrie, peut poser quelques problèmes éthiques du point de vue de son utilisation et du point de vue de la protection des données, qu’en pensez-vous ?
« Pour ma part le principe du choix est extrêmement important, surtout quand cela touche l’individu, et donc la biométrie. Chez Nuance, nous avons adopté les principes notamment défendus par le RGDP, comme un principe de base. Même pour nos clients aux États-Unis qui ne sont pas assujettis au RGDP. ».

Les grands principes de la biométrie vocale

Si la reconnaissance vocale est reconnue comme étant efficace à 99 %, contre 99,99 % pour la reconnaissance faciale, d’après le CRIM (Centre de recherche informatique de Montréal), elle comporte toutefois l’avantage d’être moins intrusif. Si ses applications peuvent être nombreuses, elle peut difficilement conduire à des dérives comme la surveillance en masse par exemple, contrairement à la reconnaissance vocale.

En outre, les problèmes de variation évoqués disposent désormais d’algorithmes compensatoires, améliorant les capacités des systèmes de reconnaissance vocale. Ces propos tenus par un chercheur du CRIM, Gilles Boulianne, lors d’une conférence sur la biométrie vocale à Montréal en 2018, viennent donc confirmer ceux tenus par les équipes de Nuance.

Voici une liste des possibles applications de la biométrie vocale : l’authentification (donner accès), la réinitialisation du mot de passe (plus pratique que des questions secrètes), sécurisation de transaction, la vérification passive, la preuve de vie (exemple le Japon vérifie si les personnes rentières sont toujours en vie grâce à un sytème de biométrie vocale), l’enquête (quand il faut un mandat pour enregistrer une conversation, les services d’ordre peuvent détecter l’identité du suspect, et dans ce cas déclencher un enregistrement vocal).

Reste le problème des attaques par enregistrement, si une personne réussit à enregistrer la voix d’un individu, il peut éventuellement s’en resservir, notamment dans une discussion ouverte. C’est pourquoi dans certains cas, les professionnels auront tendance à privilégier la reconnaissance faciale.

Actuellement, beaucoup de banques et de grandes entreprises utilisent la biométrie vocale. La CNIL a autorisé la banque Postale à utiliser un sytème de reconnaissance vocale, pour pré-remplissage de formulaire de paiement en ligne. La voix est alors chiffrée et stockée, et l’autorisation de la personne est nécessaire pour l’utiliser.