En 2016, Facebook mettait en place une intelligence artificielle dont la mission était de décrire les images et photographies publiées sur le réseau social. Destinée à rendre la plateforme plus accessible aux personnes malvoyantes ou aveugles, cette technologie a récemment eu le droit à une amélioration majeure, a annoncé la firme de Mark Zuberberg dans un billet de blog.

L’intelligence artificielle pour améliorer l’accessibilité sur Internet

Lorsque vous publiez des images ou des photographies sur Internet, vous avez (normalement) la possibilité de renseigner une balise « Texte Alternatif » afin de les décrire. L’objectif est simple : permettre aux personnes malvoyantes ou aveugles de comprendre ce que représentent les contenus visuels présents dans une page web lorsqu’elles utilisent un lecteur d’écran. Malheureusement, la très grande majorité des images publiées sur Internet ne renseignent pas cette balise, et c’est d’autant plus vrai sur les réseaux sociaux.

C’est pourquoi, dès 2016, le groupe de Mark Zuckerberg a mis en place une intelligence artificielle baptisée « automatic alternative text » (AAT) dont la mission était de décrire automatiquement les images publiées sur Facebook et Instagram, en utilisant la reconnaissance d’objets. Toujours active, cette technologie a récemment eu le droit à d’importantes améliorations.

Le géant des réseaux sociaux explique notamment que l’AAT est désormais capable de fournir des descriptions plus détaillées, notamment grâce à une identification plus précise des activités, des points de repère géographiques, des types d’animaux et des types de nourriture. Prenons un exemple concret. Par le passé, l’IA de Facebook aurait décrit : « Une photo de deux personnes près d’un bâtiment ». Aujourd’hui, et sur la même image, elle pourrait décrire : « Un selfie de deux personnes, en plein air, devant la Tour Eiffel ». Un résultat rendu possible grâce à un entraînement hebdomadaire du système qui est capable de reconnaître aujourd’hui plus de 1 200 éléments et concepts, contre 100 lors de son lancement.

L'exemple d'une image décrite par l'intelligence artificielle de Facebook.

Image : Facebook

Facebook va plus loin dans le détail

Facebook a souhaité offrir aux personnes malvoyantes et aveugles un moyen d’accéder à des descriptions d’images encore plus détaillées si elles en ressentaient l’envie. Alors, si la première description annoncée sera simple et relativement courte, les utilisateurs pourront aussi accéder à une option leur permettant d’en savoir bien plus.

Le comptage des différents éléments (par exemple « trois chapeaux », « cinq chiens », « deux casseroles »), la position des objets (en haut, en bas, à gauche, à droite, au milieu) et leur proéminence relative (« primaires », « secondaires, « mineurs ») sont autant de détails qui pourront être consultés. Sur ce dernier point, Facebook précise ne pas avoir utilisé les mots « petits » ou « grands » car cela pourrait porter à confusion par rapport à la taille réelle des objets décrits… « Même un chihuahua paraît grand s’il est photographié de près », explique le réseau social dans son article.

Exemple des détails supplémentaiers décrits par l'intelligence artificielle de Facebook.

Image : Facebook

Une initiative que l’on ne peut que saluer, et que l’on peut également retrouver chez d’autres géants du web. En 2019, Google Chrome présentait lui aussi, une intelligence artificielle capable de remplir automatiquement les balises alt pour faciliter le quotidien des personnes malvoyantes.