La NASA et IBM s’associent pour créer des modèles d’intelligence artificielle (IA) destinés aux scientifiques spécialisés dans le dérèglement climatique. Ce projet s’inscrit dans l’initiative Open Source Science de l’agence spatiale américaine, qui vise à « construire une communauté scientifique plus accessible, plus inclusive et plus collaborative ».

Un modèle formé sur des données satellitaires

L’objectif de cette collaboration est de permettre aux chercheurs de suivre et de prédire les événements climatiques et leurs conséquences de manière bien plus rapide et efficace. Cela concerne par exemple la déforestation, le rendement des cultures ou les émissions de gaz à effet.

Les deux entités vont créer deux modèles de fondation, à l’instar de GPT-4 pour ChatGPT ou de PaLM 2 pour Google Bard, qui seront entraînés sur le flux immense de données scientifiques déjà disponibles. Alimenté par les informations harmonisées du satellite Landsat Sentinel-2 recueillies sur un an, le premier modèle est basé sur la plateforme d’IA générative Watsonx d’IBM.

« La NASA gère aujourd’hui un volume de 70 pétaoctets et nos prédictions tablent sur environ 250 pétaoctets à gérer vers 2025 », commente Rahul Ramachandran, chercheur au Marshall Space Flight Center de la NASA. Seulement, il est encore difficile de tirer entièrement partie de celles-ci, mais les modèles d’IA vont justement permettre aux scientifiques de le faire.

En s’entraînant à connaître parfaitement la Terre grâce à cette vaste quantité d’informations, le modèle pourra permettre aux chercheurs de détecter les risques naturels et suivre l’évolution de la végétation et des habitats de la faune. Par exemple, il pourrait être utilisé pour estimer les dégâts causés par les tornades en détectant les toits endommagés, pour déterminer les limites des inondations, ou même pour estimer les biomasses. Il sera disponible en libre accès pour les scientifiques via la plateforme Hugging Face.

Le ChatGPT du climat

Le second modèle, toujours une collaboration entre IBM et la NASA, est comparable à un ChatGPT spécialement pensé pour les chercheurs en sciences climatiques. Il va être formé sur plus de 300 000 publications en sciences de la terre, afin d’organiser thématiquement la littérature. Il devrait faciliter la recherche et la découverte de nouvelles connaissances pour les scientifiques, en optimisant grandement les étapes telles que l’analyse d’études.

« Nous pensons que les modèles de fondation ont le potentiel de changer la façon dont les données d’observation sont analysées et de nous aider à mieux comprendre notre planète. En mettant ces modèles à la disposition du monde entier, nous espérons multiplier leur impact », assure Kevin Murphy, responsable des données scientifiques chez la NASA.