Le matériel informatique n’est pas éternel. En moyenne, un serveur se remplace tous les 3 à 5 ans. Cela pose des questions importantes sur la pérennité du stockage de données et leur archivage, particulièrement à l’heure actuelle où tout se numérise. Lors du remplacement d’une partie du matériel informatique, les données doivent être transférées avec l’assurance qu’aucun octet ne sera perdu. Un défi de taille auquel répondent les technologies de stockage par l’ADN. Microsoft revendique un pas de géant dans le domaine : du calcul informatique a été réalisé sur des données stockées dans de l’ADN.

« Nous présentons ici une technique permettant d’exécuter une recherche par similitude sur une base de données de 1,6 million d’images stockée par l’ADN », indique le communiqué présentant l’étude. Microsoft estime que les performances de cette recherche par similitude dans de l’ADN est comparable à ce qui se fait avec du matériel informatique. Dans leur étude (pdf), les chercheurs expliquent qu’ils choisissent d’appliquer leur recherche à des images car les similarités sont plus faciles à identifier. « Néanmoins, notre approche peut être appliquée à n’importe quel type de contenu, à condition qu’un outil d’extraction de données approprié soit disponible », notent les auteurs de l’étude.

Microsoft avait déjà stocké et récupéré 1 Go de données dans de l’ADN

Vulgairement, l’ADN utilisé pour stocker des données est conservé dans des tubes. Tout ce fait in vitro, c’est-à-dire pas dans un être vivant. Le stockage par l’ADN demande à ce que les données soient cryptées selon les quatre nucléotides de l’ADN (A, C, G, T) qui remplacent les 0 et 1 utilisés dans le développement informatique. « Le système utilise ensuite des équipements de laboratoire peu coûteux et courants pour faire circuler les liquides et les produits chimiques nécessaires dans un synthétiseur qui fabrique des fragments d’ADN et les pousse dans un réceptacle de stockage », détaille l’étude.

Le plus vieil ADN jamais séquencé a été récupéré sur des dents de mammouths. Le génome récupéré date de plus d’un million d’années, il va sans dire que comparé à la durée de vie de 3 à 5 ans des serveurs, l’ADN offre davantage de durabilité. Néanmoins, les aboutissements de la recherche à ce sujet demeurent limités. Un rapport (pdf) de l’académie des technologies se penchant sur la piste de l’ADN pour l’archivage des mégadonnées publié en octobre 2020, indique que « le projet le plus abouti à ce jour » a permis de stocker puis de récupérer 1 Go de données, soit la capacité de stockage d’une petite clé USB. Microsoft était déjà à l’origine de cette prouesse.

Faire du calcul informatique incarne une avancée majeure dans le domaine du stockage par l’ADN, particulièrement pour la biotechnologie. « En principe on peut stocker des données dans de l’ADN humain, mais pourquoi les mettre dedans ? Il est beaucoup plus simple de les stocker dans un centre de données où l’on peut faire de l’informatique avec », expliquait Richard Stallman, l’informaticien précurseur du mouvement du logiciel libre, à Siècle Digital au printemps 2021. À cette date, aucun calcul informatique dans de l’ADN n’avait été exécuté.