Un document interne de Meta indique que la maison mère de Facebook va déployer cette année une nouvelle puce dans ses data centers afin de soutenir son développement dans l’intelligence artificielle (IA). Baptisée en interne « Artemis », la puce doit permettre de réduire la dépendance de Meta à Nvidia, tout en contrôlant davantage les coûts croissants liés au développement des intelligences artificielles.
Pour cause, les services du groupe de Mark Zuckerberg dépensent des milliards de dollars en puces pour augmenter la puissance de calcul des applications Facebook, Instagram et WhatsApp, ainsi que de ses objets connectés comme les lunettes « Ray-Ban Stories ». Selon le fondateur du groupe de recherche sur les micro-processeurs et l’IA SemiAnalysis, Dylan Patel, un déploiement réussi de la nouvelle puce de Meta pourrait être financièrement très rentable. Cela réduirait à la fois le coût d’achat de puces de plusieurs milliards de dollars et les coûts énergétiques de plusieurs centaines de millions de dollars. « Il y a beaucoup d’argent et d’énergie dépensés qui pourraient être économisés, » résume-t-il auprès de Reuters.
Inscrivez-vous à la newsletter
En vous inscrivant vous acceptez notre politique de protection des données personnelles.
Vers une fin de la dépendance vis-à-vis de Nvidia
Artemis exécute un processus d’inférence dans lequel les algorithmes effectuent des classements d’évaluations et répondent aux requêtes des utilisateurs. Les puces fonctionneront encore avec des centaines d’unités de traitement graphique (GPU), les processeurs les plus prisés dans le domaine de l’IA. Mark Zuckerberg, PDG de Meta, a d’ailleurs annoncé l’acquisition de 350 000 processeurs H100 de Nvidia le mois dernier.
« Nos programmes internes sont complémentaires des GPU actuellement vendus sur le marché. Leur combinaison offre les performances et l’efficacité nécessaires aux charges de travail impliquées par les services de Meta », a indiqué un porte-parole de l’entreprise dans un communiqué.
Ce ne sont pas les premiers de Meta dans la course aux puces. En 2022, un premier projet a avorté. Si « Artemis » aboutit, il ne signe pas pour autant le passage de la ligne d’arrivée. Le groupe a un autre projet : une puce équivalente aux GPU, effectuant de l’inférence mais aussi de l’entraînement d’IA.