Des chercheurs de l’université du Texas ont mis au point une interface cerveau-ordinateur basée sur l’intelligence artificielle (IA) capable de convertir les pensées d’une personne en mots. Il s’agit d’une technologie prometteuse pour permettre aux patients ayant perdu la capacité de parler de communiquer à nouveau.

Une solution non invasive

Si de tels systèmes existent déjà, ils sont moins poussés car uniquement capables de détecter des mots précis et surtout, ils sont invasifs car ils requièrent l’implémentation d’un implant. « Pour une méthode non invasive, il s’agit d’un véritable bond en avant par rapport à ce qui a été fait jusqu’à présent, à savoir des mots isolés ou des phrases courtes. Nous obtenons un modèle qui permet de décoder un langage continu pendant de longues périodes avec des idées compliquées », commente Alex Huth, professeur adjoint de neurosciences et d’informatique à l’université du Texas.

Dans une étude publiée dans la revue Nature Neuroscience, les scientifiques expliquent comment ils ont entraîné un modèle de langage similaire à GPT-4 et LaMDA de Google pour parvenir à ce résultat. Ainsi, trois participants ont écouté chacun 16 heures d’épisodes différents des mêmes podcasts alors qu’ils se trouvaient dans un scanner IRMf (Imagerie par Résonance Magnétique fonctionnelle).

Contrairement à l’IRM traditionnelle, qui crée des images de la structure du corps, l’IRMf mesure les changements dans le flux sanguin et les niveaux d’oxygène dans le cerveau, qui sont supposés être associés à l’activité neuronale. En détectant ces changements, l’IRMf peut être utilisée pour cartographier le fonctionnement et l’activité du cerveau en temps réel. De cette manière, les chercheurs ont pu recueillir une importante masse de données et ont appris à l’IA à prédire l’activité cérébrale que la lecture de certains mots déclenchait. Pour la mettre à l’épreuve, ils ont fait écouter de nouveaux épisodes de podcasts aux participants, et le modèle devait deviner ce qui était dit en étudiant l’activité cérébrale de l’auditeur pendant l’écoute.

« Le résultat n’est pas une transcription mot à mot. Au contraire, les chercheurs l’ont conçu pour saisir l’essentiel de ce qui est dit ou pensé, même si c’est de manière imparfaite », précisent les chercheurs dans un communiqué de presse. Plutôt que de retranscrire parfaitement la pensée d’une personne, le modèle est capable de saisir l’idée de celle-ci. Par exemple, lorsqu’un participant entendait les mots « Je n’ai pas encore mon permis de conduire » au cours d’une expérience, ses pensées étaient traduites par « Elle n’a même pas encore commencé à apprendre à conduire ».

L’IA est prometteuse mais encore très limitée

Le modèle est parvenu à produire un texte correspondant de près ou de loin au sens voulu des mots originaux dans environ la moitié des cas. Les sujets ont également visionné un court film d’animation muet, toujours en subissant un examen IRMf. En analysant leur activité cérébrale, le modèle de langage a pu décoder un résumé approximatif de ce qu’ils regardaient.

Si ces premiers résultats sont encourageants, la technologie est encore très limitée. Les scanners IRMf sont encombrants et coûteux, tandis que l’entraînement de l’IA doit être réalisé distinctement sur chaque individu pour être efficace. Lorsque les chercheurs ont essayé d’utiliser un décodeur formé sur une personne pour lire l’activité cérébrale d’une autre, ils ont échoué, ce qui suggère que chaque cerveau a des façons uniques de représenter les sens.

« À terme, nous espérons que cette technologie pourra aider les personnes qui ont perdu l’usage de la parole à la suite de traumatismes tels que les accidents vasculaires cérébraux ou de maladies telles que la sclérose latérale amyotrophique (Ndlr : maladie de Charcot) », a expliqué Jerry Tang, étudiant diplômé en informatique à l’université du Texas et dirigeant de l’étude.

Avec ses collègues, il espère que les futures itérations de l’appareil pourront être adaptées à des plateformes plus pratiques, telles que des capteurs de spectroscopie dans l’infrarouge proche pouvant être portés sur la tête du patient.