Jeudi, Tencent a assuré détenir un stock conséquent de semi-conducteurs pour développer son modèle de langage Hunyuan. Le géant aurait réussi à se procurer une quantité suffisante de composants électroniques H800, une version bridée des puces de pointe H100 proposée par Nvidia à destination du marché chinois, avant le renforcement des restrictions américaines à l’export.

La malice de Tencent avec les puces H800 de Nvidia

Le président de Tencent, Martin Lau a déclaré avoir « suffisamment de puces pour poursuivre le développement de notre Hunyuan pour deux générations supplémentaires ». En effet, Tencent possède l’un des plus grands stocks de puces IA de tout l’Empire du Milieu. La firme avait été l’une des premières à passer des commandes pour la puce H800 de Nvidia.

Celle-ci avait été conçue par le géant américain des processeurs graphiques suite aux restrictions américaines introduites en octobre 2022, empêchant les entreprises chinoises d’exporter des composants électroniques de pointe auprès de sociétés américaines ou alliés. Le H800 reprend les bases de l’unité de traitement graphique (GPU) H100, l’un des composants les plus avancées de Nvidia, mais avec des performances bridées. Nvidia pouvait ainsi continuer de prospérer sur le marché chinois, qui lui est lucratif, tout en contournant les sanctions américaines.

Néanmoins, au cours de l’année 2023, Washington s’est rendu compte que les composants bridés proposés par le groupe dirigé par Jensen Huang étaient très prisés en Chine, car considérées comme les plus avancées disponibles dans le pays. La Maison Blanche a donc décidé de renforcer à nouveau ses sanctions à l’export, incluant les GPU bridées H800 et A800 de Nividia, rendant encore plus difficile l’accès aux puces avancées pour les entreprises technologiques chinoises. Malgré tout l’entreprise américaine n’a pas changé de stratégie, et devrait proposer de nouveaux GPU bridés dans les mois à venir, toujours pour contourner ces restrictions.

Si Tencent a anticipé le renforcement des sanctions américaines, son dirigeant sait qu’il devra à l’avenir trouver des moyens d’optimiser l’utilisation des puces IA qu’il possède, pour les conserver le plus longtemps possible. « Nous allons essayer de voir si nous pouvons transférer une grande partie de la capacité d’inférence vers des puces moins performantes, afin de pouvoir conserver la majorité de nos puces IA hautes performances à des fins de formation, » précise Martin Lau.

À la fin du mois d’août, l’Administration du cyberespace de Chine (CAC) donnait son feu vert pour la sortie publique de plusieurs technologies d’intelligence artificielle générative. Tencent n’a pas manqué le coche puisque les H800 qu’elle a à sa disposition lui servent à former et à fonctionner Hunyuan, son modèle de langage, d’ores et déjà accessible pour les professionnels, et qu’elle aimerait proposer au grand public.