Alors que de nombreuses entreprises du secteur de la tech se jettent sur l’intelligence artificielle (IA) générative, Meta réfléchit à son remplacement. Le géant a dévoilé, ce mardi 13 juin, un nouveau modèle d’IA reposant sur une architecture prédictive à intégration conjointe (JEPA) issue de la vision de Yann LeCun, vice-président et directeur scientifique de l’IA du groupe. L’objectif d’une telle technologie est de « concevoir de nouveaux modèles d’intelligence artificielle plus rapides à entraîner, capables d’accomplir des tâches complexes et de s’adapter à des situations inconnues ».
Meta introduit I-JEPA
« Dans plusieurs années, nous n’utiliserons plus de modèle de langage car nous disposerons de meilleures alternatives », affirmait Yann LeCun au centre de recherche fondamentale sur l’IA (FAIR) de Meta basé à Paris. C’est convaincu par cette idée que les chercheurs en intelligence artificielle de la société californienne ont développé I-JEPA, pour Image Joint Embedding Predictive Architecture. Celui-ci est capable d’apprendre en reproduisant un « modèle interne du monde extérieur » et en étudiant des représentations abstraites d’images, là où les modèles classiques s’efforcent à comparer pixel par pixel.
Inscrivez-vous à la newsletter
En vous inscrivant vous acceptez notre politique de protection des données personnelles.

Image : Meta.
Dans son communiqué, Meta explique que I-JEPA « offre d’excellentes performances dans de multiples tâches de vision par ordinateur et est beaucoup plus efficace sur le plan du calcul que d’autres modèles de vision par ordinateur largement utilisés ». Elle précise que cette technologie « peut être utilisée dans de nombreux domaines sans nécessiter un réglage de fond approfondi ». Plus concrètement, l’architecture JEPA soutenant I-JEPA serait deux à dix fois plus performante que les modèles de langage présents au sein de ChatGPT ou Bard.
Vers une IA de plus en plus humaine ?
D’après Yann LeCun, en s’intéressant à l’intelligence artificielle, les chercheurs se heurtent rapidement au paradoxe de Moravec : les tâches le plus simples pour l’Homme sont les plus difficiles à réaliser pour l’IA et vice-versa. Aussi, l’être humain apprend en analysant simplement son environnement. Ce n’est pas le cas des modèles de langage.
L’architecture JEPA permet à I-JEPA de deviner les informations manquantes d’une représentation abstraite « qui s’apparente davantage à la compréhension générale ». En éliminant les informations inutiles, le système est capable de proposer une reproduction d’un élément tronqué sur une image. L’entreprise basée à Menlo Park ajoute que I-JEPA « démontre le potentiel des architectures pour l’apprentissage » produisant des images sans avoir à disposition des informations supplémentaires « encodées par des transformations d’images réalisées à la main ».

Image : Meta.
Dans le futur, Meta espère étendre cette technologie à d’autres domaines « comme les données couplées à des images et du texte, ainsi que les données vidéo ». Un moyen de développer, selon Yann LeCun, une IA dont le niveau d’intelligence se rapproche de celle du chien avant de faire le grand saut, d’ici quelques années, vers l’IA proche de l’humain.