Le Web est fragile. Des milliers de sites voient le jour et disparaissent chaque jour. Wikipédia, avec l’aide du projet Internet Archive a pu récupérer 9 millions de « liens brisés » et aider à résoudre le problème des pages web qui se perdent dans le néant d’internet. Objectif : constituer une base de connaissances massive.

Le média TechCrunch nous explique que l’initiateur de ce projet s’appelle Maximilian Doerr. Il est l’un des contributeurs au projet. Il a imaginé un programme appelé Internet Archive Bot (IABot). Ce Bot a pour objectif d’identifier les liens cassés. Ces liens, vous les connaissez, il s’agit de ce qui renvoie vers une « erreur 404 » ou vers une « page non trouvée ».

Une fois dénichés, ces liens sont rattachés à la page correspondante grâce à l’action de l’IABot. Le bot trouve lui-même la page correspondante pour créer une passerelle vers celle-ci. Cela permet de préserver le contenu même si la page d’origine n’était plus disponible.

wikipédia-IABOT

Depuis 3 ans, ce petit logiciel a permis de récupérer 6 millions de liens. Certains volontaires ont contribué à la restauration de liens manuellement. Ils ont de leur côté corrigé 3 millions de liens supplémentaires en retrouvant la bonne page pour créer une passerelle vers le lien brisé. Ce travail contribue à préserver l’intégrité du Web.

À côté de cela, Wikipédia met en œuvre des actions pour simplifier son interface et œuvre pour le bien du Web. Récemment, sur la version desktop de son site, Wikipedia offrait une prévisualisation de page. Il suffit de passer votre souris un lien pour visualiser la page qui vous intéresse.

Internet est probablement notre système de conservation principal aujourd’hui. Pour le gouvernement comme pour les entreprises. Nous avons besoin de plus de projets comme celui-ci pour transmettre nos connaissances aux générations futures. Le projet mené par Internet Archive et Wikipedia est un pas positif dans cette direction.

Ce travail va clairement contribuer à renforcer la crédibilité de Wikipedia dans son ensemble. On peut imaginer que ce projet sera utile dès aujourd’hui, notamment pour les étudiants qui utilisent Wikipedia comme point de départ et doivent citer des articles « originaux » dans leurs rapports ou mémoires.