L'intelligence artificielle s'intéresse à des domaines toujours plus variés. Outre les secteurs directement liés à la high-tech, comme la reconnaissance faciale, d'autres sont aussi concernés. DeepMind le montre en mettant un nouveau modèle d'IA au service d'historiens et d'archéologues. Celui-ci, rapporte The Verge, a prouvé son potentiel en suggérant des interprétations particulièrement complètes.

Le potentiel du machine learning de DeepMind appliqué à l'histoire

Cela fait maintenant quelques années que DeepMind travaille sur ce défi. En 2019, l'entreprise dévoilait Pythia, une IA désormais utilisée lors de débats entre archéologues. À présent, c'est au tour d'Ithaca de prendre sa place.

Ithaca doit fournir des résultats plus complets que Pythia face aux défis de l'interprétation du langage. En 2019, DeepMind déclarait : « L'un des problèmes de discernement du sens à partir de fragments de texte incomplets est qu'il existe souvent plusieurs solutions possibles. Dans les jeux de mots, les joueurs devinent des lettres pour compléter un mot ou une phrase. Plus il y a de lettres spécifiées, plus les solutions possibles deviennent limitées. Mais contrairement à ces jeux, où les joueurs doivent deviner une phrase de manière isolée, les historiens restaurant un texte peuvent estimer la probabilité de différentes solutions possibles en fonction d'autres indices de contexte dans l'inscription, comme la grammaire et les considérations linguistiques, la mise en page ou le contexte historique. »

Avec Ithaca, DeepMind vient de faire la démonstration d'une intelligence artificielle capable de déduire, à partir de ces éléments, un texte manquant, mais aussi l'origine géographique d'un fragment ou sa datation à trente ans près. L'intérêt pour les archéologues est évident. Comme le rappelle Ars Technica, de nombreuses sources anciennes sont si endommagées qu'une grande partie de leurs inscriptions sont totalement illisibles. La question de leur origine géographique représente elle aussi un défi, chaque fragment ayant pu être déplacé au fil des siècles. Quant à la question de la datation, les méthodes actuelles (lorsqu'elles sont envisageables) prennent le risque d'endommager encore davantage les vestiges.

Un « outil complémentaire » et rien de plus... pour l'instant

Ithaca reprend le principe du machine learning. Avant d'être mise à l'épreuve, l'intelligence artificielle de DeepMind a été exercée sur 78 608 inscriptions grecques anciennes, chacune ayant été étiquetée de métadonnées décrivant où et quand elles ont été écrites, dans la limite des connaissances des historiens. À partir de là, le logiciel a recherché des modèles dans ces informations et les a utilisés afin de bâtir des algorithmes.

Une fois lancée, les scientifiques qui l'ont créée affirment qu'Ithaca est précise à 62% en ce qui concerne la restauration de lettres dans des textes endommagés. Elle serait en mesure d'attribuer une inscription à l'une des 84 régions du monde grec antique avec une précision de 71%. Des statistiques prometteuses, mais qui restent perfectibles. Ithaca ne peut pas se passer de l'expertise humaine, et il faut souligner que ses algorithmes reposent sur des connaissances humaines qui peuvent, elles-mêmes, se révéler fausses du jour au lendemain.

Pour Thea Sommerschield, historienne et experte en apprentissage machine, Ithaca doit davantage être considérée comme « un outil complémentaire visant à aider les historiens » et non comme un historien entièrement automisé. Le code source d'Ithaca peut d'ailleurs être amélioré : son code est disponible en open-source.