Ouvrir les langues du monde sur Wikipédia: Un aperçu de l’impact de MinT jusqu’à présent

Saviez-vous que le service Machine in Translation (MinT) de la Fondation Wikimédia prend en charge la traduction de 40.216 paires de langues? Cela signifie que les utilisateurs peuvent traduire un contenu écrit dans une langue commune vers environ 206 autres langues uniques supportées par MinT et vice versa. Cette prise en charge linguistique étendue a augmenté le nombre de traductions et les articles créés à l’aide de MinT ont un taux de suppression incroyablement faible, indiquant clairement la valeur apportée par MinT. Il n’est pas étonnant qu’il soit devenu en quelques mois le deuxième service de traduction le plus utilisé sur Wikipédia.

En juin 2023, l’équipe linguistique de la Fondation Wikimédia a présenté MinT, un outil de traduction linguistique révolutionnaire. Ce service améliore les capacités des outils de traduction de contenu de section, ce qui permet aux rédacteurs de créer des traductions juste à côté de l’article original, et automatise les étapes ennuyeuses de copie de texte dans les onglets du navigateur, de recherche de liens et de catégories correspondants, etc. MinT, hébergé sur l’infrastructure de la Fondation Wikimédia, exploite la puissance de la technologie de traduction automatique neuronale open source. Il simplifie non seulement le processus de traduction du contenu Wikimédia dans différentes langues, mais étend également sa prise en charge à des langues souvent négligées par d’autres services de traduction. MinT fonctionne en utilisant des modèles de traduction open source publiés par diverses organisations. Actuellement, il intègre des modèles de traduction de quatre organisations différentes. Vous pouvez en savoir plus sur le service ici.

Grâce à cette infrastructure, MinT peut générer des traductions initiales d’un article Wikipédia (contenu source) à partir de plusieurs modèles de traduction open source disponibles dans la langue cible pour les personnes utilisant l’outil de traduction de contenu et de section. Cela nous rapproche de la somme de toutes les connaissances dans de nombreuses versions linguistiques de Wikipédia. De plus, les individus et les organisations peuvent exploiter cette traduction automatique ouverte pour répondre à leurs besoins spécifiques en matière de traduction.

Ce service de traduction a augmenté le niveau de productivité des traducteurs en 55 versions linguistiques de Wikipédia, qui bénéficient pour la première fois du support d’un service de traduction automatique. Découvrez l’impact de MinT ci-dessous.

Données de traduction avant et après MinT

Du point de vue des utilisateurs qui bénéficient pour la première fois d’un service d’assistance à la traduction, MinT a un impact positif sur leur travail. Explorons ce que les données révèlent via notre tableau de bord analytique:

Les données montrent un changement remarquable dans les chiffres mensuels de traduction. Auparavant, les activités de traduction mensuelles atteignaient rarement 500. Cependant, au cours des derniers mois, après l’introduction de MinT, nous avons régulièrement vu plus de 1.000 traductions publiées, avec un pic de 2.150 en août. En comparaison, le mois d’août de l’année précédente ne comptait que 225 traductions publiées.

Traductions mensuelles d’année en année [source de l’image]

Le taux de suppression augmente généralement avec une activité de traduction élevée ou des pics comme première indication d’une traduction de mauvaise qualité ou d’une mauvaise utilisation de l’outil de traduction (ce qui peut être fait de bonne foi par des utilisateurs inexpérimentés). Dans ce cas, comme nous pouvons le constater dans le graphique ci-dessous, l’augmentation de l’activité de traduction après le lancement de MinT n’a pas augmenté le taux de suppression mensuel.

Taux mensuel de traductions supprimées de 2019 à ce jour [source de l’image]

Le niveau d’expérience des traducteurs, indiqué ci-dessous sur la base du nombre de modifications, montre que la plupart des traductions sont l’œuvre d’utilisateurs avec plus de 1.000 modifications (ligne verte dans le graphique ci-dessous) et de ceux ayant plus de 10.000 modifications (ligne orange dans le même graphique) dans leur compte.

Traductions mensuelles par nombre de modifications de l’utilisateur [source de l’image]

Dans le contexte de l’utilisation globale de la traduction automatique entre août et septembre 2023, MinT n’occupait pas la première place. Cependant, il a démontré son importance en facilitant 3.634 traductions dans l’outil de traduction de contenu et de sections, ce qui en fait le deuxième service d’assistance à la traduction automatique le plus utilisé. Jusqu’à présent, nos données sont en ligne avec les commentaires des utilisateurs selon lesquels MinT est un service précieux sur Wikipédia.

Les prochaines étapes avec MinT

L’équipe linguistique de la WMF a élargi son service à l’extension Translate, en proposant un service de «suggestion de traduction» aux contributeurs, comme 511KeV, qui a participé à la traduction de l’interface Wikipédia en Kashmiri, ou à ceux qui traduisent les pages multilingues sur nos plateformes, comme Translatewiki.net, Wikimedia MetaWiki et MediaWiki. L’expansion s’accompagne de nouveaux défis, comme la prise en charge de la traduction de contenus avec Wikitext et d’autres balises au-dessus des modèles de texte brut sans que les balises n’affectent ou ne manipulent mal les traductions.

En outre, l’équipe explore activement l’utilisation de MinT au-delà des limites du mouvement Wikimédia, en s’adressant aux contributeurs et aux lecteurs de Wikipédia cherchant à accéder au contenu dans différentes langues et en exposant éventuellement l’API en tant qu’infrastructure à d’autres communautés. Les capacités ci-dessus nous rapprocheront d’une communauté mondiale, partageant la richesse collective des connaissances.

Vous pouvez suivre les projets de l’équipe linguistique de la WMF sur la traduction MinT sur cette page et être notifié des nouvelles récentes en vous abonnant au bulletin d’information trimestriel de l’équipe linguistique. Si vous avez des questions sur MinT, n’hésitez pas à les poser sur la page de discussion du projet.

Nous publierons un deuxième article de blog dans quelques jours, dans lequel nous écouterons les rédacteurs de Wikimédia et leur expérience dans l’utilisation du service.