Nvidia veut améliorer les appels en visioconférence tout en les rendant moins énergivores. La firme américaine a ainsi développé une plateforme baptisée Maxine et dédiée aux développeurs de ces logiciels.

Réduire la bande passante

La visioconférence a littéralement été propulsée au devant de la scène avec la pandémie de Covid-19. Alors que la population est appelée à travailler depuis chez elle, cette technologie s’avère particulièrement pratique pour les réunions entre collègues. Preuve de ce succès : l’application Zoom a vu son chiffre d’affaires quadrupler au second trimestre de 2020, qui comprend la période entre le mois d’avril et le mois de juin. Le timing semble donc parfait pour Nvidia, dont les revenus ont eux aussi été boostés par le confinement, pour dévoiler la plateforme Maxine.

Cette dernière va améliorer la qualité des appels en les traitant via le cloud grâce aux processeurs graphiques de la firme. Nvidia promet ainsi qu’avec Maxine, la bande passante sera réduite d’un dixième par rapport aux exigences de la norme nécessaire à la compression des vidéos en streaming, qui est actuellement de H.264.

Richard Kerris, manager général des médias et du divertissement chez Nvidia, explique la démarche de l’entreprise : « Nous avons tous connu des moments où la bande passante a été une limitation dans les vidéoconférences que nous effectuons quotidiennement désormais. Si nous appliquons l’IA à ce problème, nous pouvons reconstruire les scènes de différence aux deux extrémités et ne transmettre que ce qui doit être transmis, et ainsi réduire considérablement cette largeur de bande ».

L’IA pour reconstruire le visage

En effet, Maxine exploite une technique d’intelligence artificielle baptisée réseaux antagonistes génératifs pour alléger la bande passante : « Au lieu de diffuser en continu tout l’écran de pixels, le logiciel d’IA analyse les points clés du visage de chaque personne lors d’un appel, puis réanime intelligemment le visage dans la vidéo de l’autre côté. Cela permet de diffuser la vidéo en continu avec beaucoup moins de données circulant dans les deux sens sur Internet », déclare Nvidia.

Grâce à cette méthode, la plateforme permet d’ajuster le regard des interlocuteurs afin qu’ils aient la sensation d’être face à face, d’annuler le bruit, d’être en haut résolution et d’avoir un éclairage du visage adapté, le tout sans endommager le réseau Internet des utilisateurs. La technologie utilisée est d’ailleurs similaire à celle des deepfakes. Encore une fois, il ne s’agit pas d’un outil de visioconférence à part entière, mais d’une plateforme destinée aux développeurs d’applications tierces et pour le moment, Nvidia a établi un partenariat avec l’entreprise de communication Avaya.

Si Maxine s’annonce très prometteuse, il va falloir s’armer de patience pour que son potentiel soit découvert par le grand public.