Chaque année, Nvidia organise sa conférence GTC, l’événement où sont annoncées ses dernières nouveautés et priorités pour les mois à venir. L’édition 2024, du 18 au 21 mars, ne déroge pas à la règle. L’an dernier, le spécialiste des semi-conducteurs faisait la part belle à l’intelligence artificielle (IA) générative, surfant sur l’engouement des entreprises.

Pas à pas, Nvidia guide les entreprises vers l’IA générative

Nvidia s’est imposé comme le leader des unités de traitement graphiques (GPU), très efficaces pour la formation et le fonctionnement de solutions d’IA. Nombreux sont ceux qui s’arrachent ces composants à prix d’or, mais la firme de Jensen Huang veut aller plus loin. Elle souhaite accompagner les entreprises dans leur transformation numérique.

Dans le cadre de la mise à jour d’AI Enterprise, sa suite logicielle regroupant toutes ses offres en lien avec l’IA générative, Nvidia permet aux entreprises de développer leur propre agent conversationnel. « Les plateformes actuellement utilisées par les entreprises reposent sur une mine d’or de données qui peuvent être transformées en copilotes d’IA générative », appuie Jensen Huang, PDG de Nvidia.

En parallèle, la société s’est penchée sur la phase d’inférence. Elle constitue l’essence même des IA génératives actuelles. Pour assister les développeurs dans cette phase, Nvidia lance NIM. « NVIDIA NIM a été conçu pour combler le fossé entre le monde complexe du développement de l’IA et les besoins opérationnels des entreprises », précise le groupe. Ce service propose aux développeurs des outils sécurisés, conformes aux normes de l’industrie, et des moteurs d’inférence optimisés.

Si ces services restent généralistes, Nvidia propose aussi des outils à destination de secteurs spécifiques : avec BioNeMo, le groupe vise à aider les chercheurs en pharmacie à développer des modèles optimisés pour la découverte de médicaments.

Nvidia AI Enterprise.

Avec AI Enterprise, Nvidia veut accompagner les sociétés de secteurs divers et variés dans leur adoption de l’IA, en fonction de leurs besoins. Illustration : Nvidia. Illustration : Nvidia.

Pour répondre à la forte demande en GPU, Nvidia met les bouchées doubles

En matière de composants électroniques, dans les prochains mois, les entreprises spécialisées dans l’IA pourront se procurer les très attendues H200. Amazon Web Services, Google Cloud, Microsoft Azure et Oracle se sont tous engagés à exploiter ce nouveau GPU dans leurs infrastructures. En 2025, ce sera au tour des puces X100 de voir le jour. Aucune précision n’a été apportée sur ses performances.

Niveau infrastructures, la firme dévoile son nouveau système DGX SuperPOD spécialement conçu pour les workflow d’IA. Afin de proposer une grande puissance de calcul pour supporter les dizaines de milliards de paramètres des grands modèles de langages, pas moins de 36 GPU Blackwell 200 (GB200) sont inclus dans ce DGX. Selon Nvidia, ces composants offrent « des performances jusqu’à 30 fois supérieures à celles du H100 pour les grandes charges de travail d’inférence de modèles de langage ».

Nvidia DGX SuperPOD.

Ce nouveau DGX fournit 11,5 exaflops de puissance de calcul, et 240 téraoctets de mémoire rapide. Illustration : Nvidia.

La firme de Jensen Huang au service de l’informatique quantique

Si l’informatique quantique est loin d’être sa priorité, Nvidia souhaite que ses composants puissent être un moteur des avancées dans le secteur. « L’informatique quantique représente la prochaine frontière révolutionnaire de l’informatique et il faudra les esprits les plus brillants du monde pour rapprocher encore un peu cet avenir », souligne Tim Costa, directeur de l’informatique quantique et du calcul haute performance chez Nvidia.

L’entreprise annonce que ses composants permettront d’alimenter le nouveau supercalculateur japonais ABCI-Q. En tout, 2 000 GPU H100 seront inclus dans la machine. Ce superordinateur, dont la construction est assurée par Fujitsu, sera installé à l’Institut national des sciences et technologies industrielles avancées (AIST) à Tokyo. Il sera déployé dès l’année prochaine.

Dans un autre registre, à l’image de ce qu’a pu proposer Intel ces derniers mois avec Quantum SDK, Nvidia dévoile un service cloud qui permet aux chercheurs et aux développeurs « de repousser les limites du quantique et de l’exploration informatique dans des domaines scientifiques clés, notamment la chimie, la biologie et la science des matériaux ». Quantum Cloud est basé sur une version quantique de CUDA, la plateforme de calcul parallèle et interface de programmation d’application présente dans le GPU de l’entreprise. Ainsi, les utilisateurs pourront concevoir et tester leurs applications quantiques dans le cloud.

Cloud, informatique quantique et semi-conducteurs avec Quantum cloud.

De plus en plus d’entreprises cherchent à démocratiser l’accès à l’informatique quantique grâce à des simulateurs de machines quantiques. Illustration : Nvidia.

Nvidia se voit en pionnier de l’industrie 4.0

Depuis quelques années, Nvidia travaille sur le métavers. « Nous pensons que ces mondes virtuels seront l’élément qui permettra la prochaine ère d’innovation », déclarait il y a trois ans Richard Kerris, vice-président du développement de la plateforme Omniverse. Depuis, cette technologie est beaucoup moins à l’air du temps. Mais Nvidia concentre ses efforts sur l’aspect professionnel, en présentant Omniverse comme un espace de travail permettant de créer des jumeaux numériques réalistes et complexes.

La plateforme est mise à jour afin de donner une place prépondérante à l’intelligence artificielle générative. Les entreprises ont désormais la possibilité de former des agents d’IA pour simuler avec plus de réalisme, le déplacement de robots et d’humains virtuels dans un entrepôt ou une zone industrielle. Nouveauté non négligeable, Nvidia permet à ses utilisateurs de s’immerger dans l’environnement 3D qu’ils ont conçu s’ils disposent du Vision Pro, le casque de réalité mixte d’Apple. L’utilisateur d’Omniverse peut se glisser dans le jumeau numérique et interagir avec des objets présents dans le monde virtuel qu’il a imaginé.

Une personne utilisant Nvidia Omniverse avec l'Apple Vision Pro.

Ici, un utilisateur d’Omniverse se sert de son casque Vision Pro pour sélectionner les composants du véhicule qu’il développe. Illustration : Nvidia.

Enfin, c’est dans le monde de l’automobile que Nvidia assure avoir fait une entrée fracassante. En septembre 2022, Nvidia dévoilait Drive Thor, un système sur puce (SoC) permettant de centraliser toutes les fonctions intelligentes d’un véhicule. Un an et demi plus tard, plusieurs grandes entreprises du secteur ont décidé d’alimenter leur flotte avec ce SoC. Nvidia présente la nouvelle génération de Drive Thor pour répondre aux envies des constructeurs qui cherchent à inclure l’IA générative dans leurs véhicules.

Avec toutes ces annonces et nouveautés, Nvidia veut confirmer sa belle année 2023 où elle est devenue un peu plus, un acteur incontournable du secteur de la tech. L’entreprise continue à faire des avancées sur ce qui a fait sa renommée, à savoir l’IA générative et les jeux vidéo. En parallèle, elle souhaite aller plus loin en touchant plusieurs domaines où peut apporter son expertise : robotique, santé, informatique quantique, jumeaux numériques et métaverse. La stratégie de Nvidia est claire, voyons désormais si elle portera ses fruits dans les prochaines années.