Imaginez-vous dans une pièce sombre avec une seule bougie. Lorsque vous approchez la flamme d’une bougie d’une autre bougie éteinte, l’obscurité recule, tandis que votre flamme initiale continue de brûler avec éclat. Ce geste symbolise un ancien proverbe italien : « Une bougie ne perd rien en allumant une autre bougie. » Cette métaphore illustre l’une des innovations transformatrices de Wikipédia : l’outil de traduction de contenu. Tout comme les bougies diffusent la lumière, cet outil a contribué à « mettre en lumière » plus de 2,4 millions d’articles traduits dans différentes langues sur Wikipédia.

Capture d’écran montrant le nombre d’articles traduits à l’aide de l’outil de traduction de contenu.

Avant le lancement de l’outil de traduction de contenu, il existait un important déficit de connaissances dans les Wikipédias en langues sous-représentées. Alors que les éditions en anglais et dans d’autres langues majeures prospéraient avec des millions d’articles bien documentés, les Wikipédias en langues moins représentées étaient confrontées à une réalité décourageante, avec un nombre très faible de contenus bien documentés. Les conclusions de la recherche de Scott Hales sur l’influence et les habitudes d’édition des contributrices et contributeurs multilingues sur Wikipédia ont également révélé que les contributrices et contributeurs multilingues dont la langue maternelle est une langue sous-représentée éditent souvent des types de contenu similaires sur les deux Wikipédias. Par exemple, les langues d’Afrique de l’Ouest, telles que le haoussa et l’igbo, avaient peu de contenu dans leurs Wikipédias, et les contributrices et contributeurs multilingues ont travaillé à enrichir les connaissances dans ces langues en traduisant du contenu provenant des Wikipédias en anglais et dans d’autres langues plus répandues.

En conséquence, le fait d’être monolingue dans ces langues maternelles a considérablement limité l’accès à la sagesse collective de l’humanité. Grâce à un accès plus facile et plus efficace aux outils de traduction, davantage d’editrices et d’éditeurs multilingues peuvent contribuer à améliorer à la fois la base de connaissances et la base de contributrices et contributeurs dans leur langue maternelle.

Un histogramme qui montre le nombre d’articles créés avec et sans l’outil de traduction de contenu dans la région de l’Afrique de l’Ouest sur plusieurs années.

Avant l’apparition de l’outil de traduction de contenu, les contributrices et contributeurs bilingues rencontraient des difficultés pour traduire les articles Wikipédia. Elles et ils devaient copier le contenu dans un document séparé, le traduire en tenant compte du contexte, puis le mettre en forme et le citer à l’aide du wikitexte, tout en respectant les règles d’édition. Ce processus fastidieux freinait la participation des bénévoles, en particulier dans les Wikipédias en langues sous-représentées, où les compétences numériques sont souvent limitées. Rédiger des articles à partir de zéro dans ces langues prenait également beaucoup de temps.

Lancement de l’outil de traduction de contenu

L’outil de traduction de contenu, lancé par la Fondation Wikimédia en 2015, a automatisé le fastidieux processus de traduction, facilitant ainsi la diffusion de la richesse des connaissances de Wikipédia dans différentes langues grâce à un processus de révision humaine, garantissant la préservation du contexte qui définit Wikipédia, comme l’ont souligné les locuteurs catalans lors d’une table ronde. Au fil des années, à mesure que l’équipe de langues et localisation de produits Wikimédia (anciennement l’équipe langues) a perfectionné et amélioré l’outil, nous avons assisté à une croissance remarquable de la création de contenu dans les langues sous-représentées, contribuant ainsi à l’équité des connaissances. Il est important de noter que l’écart de connaissances sur Wikipédia ne concerne pas seulement le nombre d’articles, mais aussi la diversité des sujets traités. Au départ, les éditions de Wikipédia en Asie du Sud et en Afrique de l’Ouest se caractérisaient par une prédominance d’articles géographiques et biographiques, laissant de côté des sujets essentiels tels que les STIM, la culture et l’histoire. L’outil contribue progressivement à combler ces lacunes thématiques dans ces sous-régions.

La diffusion des connaissances à travers les continents

Grâce à des initiatives collaboratives avec les communautés de bénévoles de Wikipédia et à des campagnes en faveur de l’équité des connaissances, les contributrices et contributeurs ont fait des progrès considérables en utilisant cet outil pour ajouter du contenu et augmenter le nombre et la couverture d’articles dans diverses versions de Wikipédia. En voici quelques exemples :

Grâce aux contributions distinctives apportées en igbo et en haoussa, cet outil a permis de créer 80 % de l’ensemble du contenu, mettant en lumière des sujets clés liés aux STIM, à la culture, à l’histoire et à la société, qui n’étaient auparavant pas disponibles dans ces langues. Aliyu, un éditeur bénévole nigérian, a expliqué dans un article qu’avant l’existence de cet outil, il ne pouvait pas imaginer ce que cela pouvait être de traduire manuellement des articles sur la santé de l’anglais vers le haoussa sur Wikipédia.

Un histogramme représentant le nombre de traductions publiées dans différentes versions de Wikipédia, mettant en évidence les publications en igbo et en haoussa.

Les histogrammes montrent le niveau de dépendance à l’égard de l’outil de traduction de contenu pour la création d’articles dans quatre domaines thématiques au sein des Wikipédias en igbo et en haoussa.

Les Wikipédias en langues indo-aryennes (telles que le télougou, le tamoul, le népalais, le bengali, le kannada, le marathi, l’ourdou, l’odia, l’assamais et le cachemiri) ont connu une croissance annuelle constante du nombre d’articles traduits. Ces Wikipédias, qui sont largement utilisés en Asie du Sud, sont passés de moins de 11 000 articles sur des sujets liés aux STIM à plus de 59 641 en seulement trois ans.

Graphique illustrant la croissance du nombre d’articles créés à l’aide de l’outil de traduction de contenu dans certaines Wikipédias en langues indo-aryennes.

Pendant la pandémie de Covid-19, cet outil a aidé le groupe de travail de traduction à rendre les articles sur le COVID-19 de l’initiative WikiProjet COVID-19 disponibles dans plus de 130 langues en peu de temps. Cela a contribué à réduire le risque de désinformation sur le COVID-19 et à fournir des informations fiables au monde entier pendant et après le confinement.

Notably, articles generated through the translation tool have been measured to be less likely to be deleted than those created from scratch. Indicating that when carefully edited and reviewed by humans, these machine-assisted outputs yield high-quality content in many language Wikipedias.

Une décennie d’améliorations constantes

À l’instar d’un jardinier qui prend soin de ses semis, l’équipe langues et localisation de produits de Wikimédia a développé l’outil de traduction de contenu au cours de la dernière décennie. Comme le dit le proverbe chinois, « un voyage de mille kilomètres commence par un premier pas ». Le lancement du produit minimum viable a marqué ce premier pas, qui a consisté à semer les graines dans le vaste jardin de Wikipédia. Chaque amélioration a fait évoluer l’outil, conduisant à des progrès remarquables :

Intégration de la traduction automatique Google (2016) qui a accéléré le processus de traduction dans plusieurs versions linguistiques de Wikipédia en incorporant des premières ébauches automatiques issues de Google Translate. Vous pouvez en savoir plus sur l’impact de cette fonctionnalité dans les conclusions d’un chercheur.

qui a accéléré le processus de traduction dans plusieurs versions linguistiques de Wikipédia en incorporant des premières ébauches automatiques issues de Google Translate. Vous pouvez en savoir plus sur l’impact de cette fonctionnalité dans les conclusions d’un chercheur. Amélioration de la gestion des modèles et des citations (2018) , quia permis de convertir facilement des modèles complexes dans des articles scientifiques lors de la traduction, tout en préservant les références et l’intégrité du contenu.

, quia permis de convertir facilement des modèles complexes dans des articles scientifiques lors de la traduction, tout en préservant les références et l’intégrité du contenu. Expérience de traduction collaborative sur mobile (2021), quia permis à plusieurs éditrices et éditeurs de travailler simultanément sur différentes sections d’un même article, améliorant ainsi la collaboration.

Dès 2021, l’outil avait évolué pour relever les défis sociologiques et technologiques, devenant un outil robuste permettant aux utilisatrices et utilisateurs d’ordinateurs de bureau et d’appareils mobiles de traduire collaborativement des articles section par section tout en détectant les erreurs de traduction automatique.

D’autres avancées techniques ont continué à élargir la portée de l’outil :

MinT Machine Translation : extension de la prise en charge de la traduction à plus de 40 000 paires de langues. Cela a permis d’augmenter le niveau de productivité des traductrices et traducteurs dans 55 éditions linguistiques de Wikipédia, qui ont bénéficié pour la première fois de la prise en charge de la traduction MinT. Pour plus de détails, consultez cet article.

: extension de la prise en charge de la traduction à plus de 40 000 paires de langues. Cela a permis d’augmenter le niveau de productivité des traductrices et traducteurs dans 55 éditions linguistiques de Wikipédia, qui ont bénéficié pour la première fois de la prise en charge de la traduction MinT. Pour plus de détails, consultez cet article. Fonctionnalité de suggestion de traduction personnalisée : Il s’agit d’une amélioration récente apportée par l’équipe. Ce travail a amélioré la prise en charge de la liste de suggestions d’articles par l’outil de traduction de contenu, permettant aux utilisatrices et utilisateurs de personnaliser et de recevoir des recommandations d’articles basées sur 41 filtres thématiques. Elles et ils peuvent ainsi découvrir et traduire des articles dans leur domaine d’intérêt et d’expertise, ainsi que découvrir des listes sélectionnées par la communauté, appelées Collections, qui s’inspirent d’initiatives de campagnes de croissance de contenu. Actuellement, cette fonctionnalité compte environ 50 collections, et d’autres sont en cours d’amélioration.

Il s’agit d’une amélioration récente apportée par l’équipe. Ce travail a amélioré la prise en charge de la liste de suggestions d’articles par l’outil de traduction de contenu, permettant aux utilisatrices et utilisateurs de personnaliser et de recevoir des recommandations d’articles basées sur 41 filtres thématiques. Elles et ils peuvent ainsi découvrir et traduire des articles dans leur domaine d’intérêt et d’expertise, ainsi que découvrir des listes sélectionnées par la communauté, appelées Collections, qui s’inspirent d’initiatives de campagnes de croissance de contenu. Actuellement, cette fonctionnalité compte environ 50 collections, et d’autres sont en cours d’amélioration. Un tableau de bord unifié facilite l’accès aux mêmes fonctionnalités sur les ordinateurs de bureau et les appareils mobiles. Les utilisatrices et utilisateurs d’ordinateurs de bureau ont ainsi la possibilité de traduire des articles section par section et de personnaliser les filtres afin d’obtenir des suggestions de traduction qui correspondent à leur domaine d’intérêt.

La carte d’amélioration de cet outil illustre les progrès réalisés et souligne une philosophie : des itérations continues et réfléchies, accompagnées d’améliorations progressives, conduisent à des résultats significatifs au fil du temps, comblant peu à peu un océan de possibilités.

Votre rôle dans l’équité des connaissances

L’évolution de cet outil reflète notre engagement en faveur de l’amélioration continue et de l’élargissement de l’accès à des informations de haute qualité, révisées par des humains, dans divers domaines, notamment les STIM, la culture et l’histoire. Chaque article traduit crée de nouvelles connexions et encourage davantage de personnes à participer à cet effort mondial. Voici comment vous pouvez vous impliquer :

Pour les éditrices et éditeurs multilingues : utilisez l’outil de traduction de contenu pour traduire un article dans les langues que vous connaissez. Même un seul article peut aider quelqu’un à trouver des informations dans sa langue maternelle.

Pour les organisatrices et organisateurs de campagnes de développement de contenu : organisez des événements de traduction axés sur des sujets importants pour les langues sous-représentées et utilisez la balise de collection de pages pour attirer davantage de traductrices et traducteurs vers votre liste d’articles à traduire.

L’outil de traduction de contenu témoigne de l’engagement de Wikipédia à rendre les connaissances accessibles à tous. Ensemble, nous pouvons contribuer à partager les connaissances et à ouvrir la voie à d’autres afin d’élargir la curiosité et la compréhension de tous.

Pouvez-vous nous aider à traduire cet article ? Pour que cet article soit diffusé au plus grand nombre, nous avons besoin de votre aide. Pouvez-vous traduire cet article pour faire passer le message ? Commencer la traduction