Comme beaucoup, Facebook semble avoir compris les bénéfices qu’il peut tirer de l’intelligence artificielle. Facebook a déjà mis au point une intelligence artificielle capable de transformer un style de musique en un autre, et une autre pour lutter contre les deepfakes. Aujourd'hui, comme le rapporte Venturebeat  une nouvelle technique IA a été dévoilée. Elle s'intitule Ego-Topo et serait en mesure de comprendre les relations entre différents lieux uniquement à partir d’images tirées de vidéos.

Ego-Topo, la nouvelle technique de Facebook AI Research et l’Université du Texas

La section de recherche en intelligence artificielle de Facebook a collaboré avec l’Université du Texas pour exploiter Ego-Topo. Cette nouvelle technique va décomposer un espace issu d’une vidéo et transformer la vision en une carte topologique des activités. À partir de cela, Ego-Topo pourra organiser les vues de la vidéo en série de visites des différentes zones.

Puisque Ego-Topo organise ce qu’il perçoit, il est ensuite capable de comprendre le comportement de la personne et l’action réalisée dans le lieu. Cela va notamment lui permettre de réagir et de se demander, notamment, quelle est l’action la plus probable que fera cette personne dans le futur ou encore quelles sont les interactions possibles avec des objets à cet endroit précis.

Grâce à cette compréhension des éléments et en exploitant un modèle d’intelligence artificielle, Ego-Topo est en mesure de relier des éléments entre eux depuis les images vues. Cela va par exemple se traduire par la reconnaissance d’un lave-vaisselle plein sur une image et le même, vide, sur une autre; ou encore l’association d’une poubelle dans une pièce et d’un broyeur à ordures dans une autre.

Selon les équipes de recherche, les résultats sont excellents

Les chercheurs de l’Université du Texas rapportent que les résultats de la nouvelle technique sont bons, voire même meilleurs que leurs données de référence. Ego-Topo a réussi à déduire les interactions probables entre des objets et anticiper les actions nécessaires pour exécuter une activité longue. Au cours de cette seconde expérience, les chercheurs ont jugé Ego-Topo excellent.

Cela leur permet donc d’affirmer que la technique développée est “la mieux adaptée aux activités à long terme où les zones sont visitées à plusieurs reprises et utilisées de multiples façons au fil du temps”. Leur avancée permet de contrer le comportement habituel des systèmes de visions assistées par ordinateur. En effet, ceux-ci excellent généralement dans la détection d'objets, mais ont du mal à comprendre les environnements dans lesquels ces objets sont utilisés. Egp-Topo montre donc que cette compréhension est tout à fait possible.