Alors que la bataille du cloud fait rage, Google vante les prouesses de son modèle le plus avancé, Gemini, auprès de ses clients. À l’occasion de sa conférence annuelle dédiée au cloud, à Las Vegas, la société a également présenté ce 9 avril une nouvelle application pour sa suite Workspace, avec l’objectif de concurrencer plus férocement son rival, Microsoft.

Google veut rassurer sur la fiabilité de son modèle

C’est son moment. Thomas Kurian, directeur général de Google Cloud, a profité de l’événement pour faire la démonstration des nouvelles fonctionnalités de Gemini, le modèle d’intelligence artificielle (IA) le plus puissant de l’entreprise.

Un choix qui n’est pas anodin : la firme de Mountain View considère son activité cloud comme la plus propice à la croissance. Si elle est largement devancée par Amazon Web Services (AWS) et Microsoft Azure, elle espère que ses efforts dans l’intelligence artificielle lui permettront de combler ce retard. Elle est sur la bonne voie : 2023 a été la première année profitable de l’histoire de Google Cloud.

Google souhaite tout d’abord renforcer la fiabilité de son IA, dont la version grand public a récemment été secouée par une polémique. Le modèle a en effet généré des visuels historiques inexacts, suscitant l’indignation des internautes et les remontrances du grand patron, Sundar Pichai. Ainsi, les résultats issus de Search vont servir de source d’information pour les réponses de Gemini, offrant davantage de certitude aux utilisateurs de l’IA.

De même, les entreprises peuvent utiliser Gemini pour créer des images destinées à des campagnes publicitaires. L’outil professionnel est assorti de 19 contrôles différents permettant de s’assurer que le contenu est conforme à la marque.

Les fonctionnalités de Gemini décuplées

L’année dernière, Google s’est surtout concentré sur les capacités de l’IA pour optimiser les tâches quotidiennes, à l’instar de la rédaction d’e-mails ou de pitchs. Elle va maintenant plus loin.

Vertex AI, la plateforme dédiée aux développeurs de Google Cloud, décuple les possibilités offertes par son IA avec la nouvelle version Gemini 1.5. Il dispose de la « plus longue fenêtre contextuelle » de tous les grands modèles de langage (LLM), assure l’entreprise. Concrètement, il peut générer des réponses à partir de milliers d’images, de vidéos, de documents ou de fichiers audio. Il est par exemple capable de créer un podcast ou diaporama à partir des données d’une entreprise.

La cybersécurité a également été mise à l’honneur. Gemini devrait assister les clients de Google Cloud à analyser et corriger les menaces et vulnérabilités. Outre l’IA, ces nouvelles fonctionnalités sont basées sur le rachat en 2022 de Mendiant par Google, pour un montant de 5,4 milliards de dollars.

Un concurrent à PowerPoint

En parallèle, Google a présenté une nouvelle application dédiée à sa suite d’outils Workspace. Vids est décrit comme un « assistant tout-en-un » pour la vidéo, l’écriture, la production et l’édition. Faire une présentation, informer ses équipes, expliquer un concept compliqué… Ses usages sont nombreux.

Capture d'écran de l'application Vids.

Image : Google.

Considéré par Google comme un sérieux concurrent à PowerPoint, le logiciel s’intègre avec Gemini, qui permet de l’utiliser simplement en langage naturel. De même, il est relié de manière fluide aux autres plateformes de Google, rendant le processus de création d’autant plus harmonieux.