Cette année, le Texas expérimentera un nouvel outil pour corriger les examens d’aptitudes des élèves inscrits dans les établissements publics de l’état. Ce nouveau système de notation sera basé sur l’intelligence artificielle (IA) et viendra remplacer la majorité des correcteurs humains.

L’IA pour corriger les copies, mais sous le contrôle de correcteurs humains

Dans le cadre d’une expérimentation à grande échelle, la Texas Education Agency (TEA), l’équivalent de l’académie en France, va déployer un « moteur de notation automatisé ». Le but : économiser entre 15 et 20 millions de dollars par an grâce à l’IA. Cette solution exploite un grand modèle de langage qui serait capable d’analyser l’ensemble des réponses proposées par les élèves dans le cadre de leur examen de compétences.

Afin de développer ce système de notation, la TEA a rassemblé 3 000 réponses qui ont été soumises à deux groupes de correcteurs humains différents. À partir de cette base de données, le moteur de notation automatisée décrypte les mots-clés attendus dans une réponse, la longueur des phrases, la manière dont elles sont construites. L’IA donne ensuite le point ou non à l’élève.

Après avoir corrigé l’ensemble des questions, l’ordinateur les analyse une dernière fois et indique s’il est certain ou non de la note qu’il a attribuée. Si ce n’est pas le cas, la copie de l’élève sera automatiquement réattribuée à un correcteur humain. Dans tous les cas, un quart des questions initialement corrigées par l’ordinateur seront également examinées par des humains. Si les résultats des deux corrections ne sont pas rigoureusement semblables, le correcteur humain prendra le temps d’examiner toute la copie. Enfin, si l’élève et ses parents ne sont pas satisfaits de la correction, ils pourront demander un nouvel examen de la copie moyennant 50 dollars.

Ce changement intervient un an après que les tests STAAR, passés par tous les élèves texans âgés de 8 à 14 ans, ont été modifiés. Ces examens font désormais la part belle aux questions ouvertes, au détriment des questions à choix multiples, augmentant drastiquement le nombre de réponses construites. D’après le Texas Tribune, la TEA assure que la charge de travail aurait été nettement plus conséquente pour les correcteurs humains. Désormais, ils seront plus de 2 000 à corriger manuellement les copies, contre 6 000 correcteurs par le passé.

Malgré ces justifications, un bon nombre d’éducateurs, de parents, et d’élèves sont inquiets de la mise en place de ce système de notation. Une inquiétude plutôt louable lorsque l’on sait que les résultats des tests STAAR déterminent l’orientation scolaire des élèves. En mars, un ingénieur de Microsoft assurait que les spécialistes de l’IA générative étaient loin d’avoir éradiqué toutes les défaillances de leurs modèles. Difficile de dire, malgré toutes les précautions prises par la TEA, si l’outil prochainement déployé sera fiable à 100 %.