La Bibliothèque nationale suisse crée une collection d’articles de Wikipédia

Coopération avec Wikimedia CH

Suisse – Afin que la source de savoir que constitue Wikipédia soit conservée dans son intégrité et reste accessible de manière sûre pour les générations futures, la Bibliothèque nationale suisse met en place une collection numérique dans laquelle elle rassemble des contenus de Wikipédia en lien avec la Suisse, en les archivant durablement et en les mettant librement à disposition en ligne. La collection Wikipédia est répertoriée dans le catalogue de la bibliothèque Helveticat ; elle peut être recherchée et consultée sous e-Helvetica Access, le portail d’accès aux collections numériques de la Bibliothèque nationale.

Wikimedia CH, l’association pour la promotion du savoir libre en Suisse, salue et soutient cette nouvelle collection numérique. Les deux organisations coopèrent étroitement en vue de sa réalisation.

Différence avec l’article en direct

La différence entre la forme archivée de l’article et l’article de Wikipédia en direct réside dans le fait que l’article archivé, « gelé », ne sera plus modifié dans les archives à long terme. Par contraste, l’article de Wikipédia en direct peut évoluer à tout moment, grâce à la collaboration des contributrices et contributeurs bénévoles. Néanmoins, ce n’est pas parce que Wikipédia est en ligne que, pour autant, cette encyclopédie en ligne est sécurisée pour l’éternité. Cela, seule une institution de mémoire, avec un mandat correspondant, peut le garantir. La Bibliothèque nationale a une telle mission. Celle-ci se base sur la loi fédérale sur la Bibliothèque nationale et, dans ce cadre, elle doit être considérée comme infinie.

Le défi de la relation avec la Suisse

La Bibliothèque nationale collecte régulièrement des articles. Elle en crée, en quelque sorte, un instantané à un moment donné. Pour des raisons techniques, la présentation peut être légèrement différente visuellement, ou certaines fonctionnalités peuvent être désactivées. L’objectif est de reproduire aussi fidèlement que possible l’article en direct dans sa version archivée. Le principal défi, cependant, est l’identification des articles en lien avec la Suisse. Dans quelle mesure peut-on considérer qu’un article a un rapport avec la Suisse, et un autre, non ? Où fixer les limites ?

Archivage à long terme par PET-scan

Techniquement, les articles en lien avec la Suisse sont identifiés grâce à l’outil d’interrogation PET-scan et les articles répertoriés dans le “Projet Suisse” de Wikipédia. Ensuite, les URL ou les contenus sont récupérés par script, copiés, téléchargés, introduits dans le système d’archivage à long terme, puis traités.

Une sélection opérée par la Bibliothèque nationale

Le choix des contenus, de même que la constitution de cette collection numérique, sont exclusivement du ressort de la Bibliothèque nationale. Celle-ci reprend les articles de Wikipédia directement depuis Wikipédia, les répertorie dans son catalogue, veille à leur archivage durable et les met librement à disposition sur Internet. Il incombe également à la Bibliothèque nationale d’entretenir et de développer la collection. Pour ce faire, aucune participation pratique de Wikimedia CH ou de la communauté Wikipédia n’est nécessaire. Les contenus sont collectés dans les quatre langues nationales, à savoir dans les éditions de Wikipédia en allemand, en français, en italien et en romanche. La collecte de contenus dans d’autres langues n’est pas exclue à long terme. Les partenaires disposent en outre de processus organisationnels internes et de mesures permettant de traiter rapidement les signalements de contenus potentiellement illicites.

Aucune prétention à l’exhaustivité

Le projet a été initié fin 2020. 2021 et 2022 ont permis de jeter les bases de la collecte, de l’archivage et de la communication des contenus de Wikipédia. Ensuite, la constitution de la collection a commencé. La compilation représentative ne prétend nullement être exhaustive. Outre les textes, la Bibliothèque nationale prendra en compte tous les contenus inclus dans les articles de Wikipédia : images, graphiques, audios, vidéos, outre la liste des contributrices et contributeurs et les conditions de licence en vigueur, etc., y compris les métadonnées les concernant. Ne seront pas collectées, en revanche, les pages de projet, les pages de Wikipédia qui ne font pas partie de l’encyclopédie (par exemple les pages d’utilisateurs), les bannières et autres communications de Wikimedia (par exemple les appels aux dons), les redirections et les pages de désambiguïsation (pages d’explication de termes).

 
 
Définitions :

La Bibliothèque nationale suisse (BN) est une institution de mémoire relevant de la Confédération. Elle a pour mandat légal de collecter, répertorier, rendre accessibles et conserver toutes informations en lien avec la Suisse [Loi fédérale sur la Bibliothèque nationale suisse (LBN/NBibG), art. 2 ; RS 432.21]. Parmi les informations collectées sous format numérique par la Bibliothèque nationale figurent, outre des livres, normes, publications académiques et revues, également des sites internet suisses. Les articles de Wikipédia ayant trait à la Suisse en font également partie.

Le terme e-Helvetica désigne les collections numériques de la Bibliothèque nationale. C’est pourquoi la plateforme permettant de rendre accessibles lesdites collections numériques s’appelle e-Helvetica Access. e-Helvetica est également le nom d’un service de la Bibliothèque nationale dans lequel les contenus nés numériques (« born-digital ») sont collectés, répertoriés, conservés et mis à disposition.

Liens complémentaires

Pour toutes questions complémentaires, contacter :

  • Bibliothèque nationale suisse : Barbara Signori, Responsable du service e-Helvetica, e-mail : barbara.signori@nb.admin.ch, Tél. : +41 58 464 03 07

Wikimedia CH : Kerstin Sonnekalb, Outreach & Communication, e-mail : press@wikimedia.ch, Portable : +41 78 813 13 26