Willkommen zur Ausgabe Januar 2024 des Newsletters Sprache und Internationalisierung des Sprachenteams der Wikimedia Foundation!
In diesem Newsletter findest du vierteljährliche Updates zu neuen Entwicklungen von Features, Verbesserungen in verschiedenen sprachbezogenen technischen Projekten und Unterstützungsarbeiten, Community-Versammlungen und Ideen, wie du zu den Projekten beitragen kannst.
Die wichtigsten Highlights
Fon Wikipedia ist nach fünf Jahren Entwicklung im Wikimedia-Inkubator offiziell gestartet
Fon Wikipedia, das beim Wikimedia Hackathon 2018 in Barcelona entstanden ist, ist nach dem Abschluss des Inkubators offiziell gestartet! Fon wird von Millionen Menschen in Benin und Togo gesprochen und ist für viele die Muttersprache. In Benin ist Fon auch als Nationalsprache weit verbreitet. Es hat fünf Jahre gedauert, diese neue Fon-Wikipedia zu erstellen. Da viele Menschen nicht in Fon schreiben können und die Muttersprachen in Afrika weniger Beachtung finden als andere, war es für die Community-Mitglieder, die das Projekt ins Leben gerufen haben, eine große Herausforderung, eine Community zur Unterstützung aufzubauen. Erfahre außerdem mehr über die vier neuen Wikimediaprojekte, die kürzlich genehmigt wurden (Wikipedia Dagaare, Wikipedia Moroccan Amazigh, Wikipedia Toba Batak und Wikiquote Banjar).
Einführung von Sentencex, einem Tool für verbesserte natürliche Sprachverarbeitung (Natural Language Processing, NLP) und mehrsprachige Satzextraktion
Das Sprachteam hat gerade ein neues Tool namens Sentencex vorgestellt, das jetzt sowohl in Python als auch in Javascript verfügbar ist. Bei der Satzsegmentierung, einem wichtigen Teil der natürlichen Sprachverarbeitung, wird ein Text in einzelne Sätze zerlegt. Dieser Prozess wird auf vielfältige Weise eingesetzt und trägt dazu bei, die Funktionalität und Geschwindigkeit der Sprache zu verbessern, insbesondere im neuen maschinellen Übersetzungssystem von Wikimedia (Machine in Translation, MinT) und im Projekt zur Übersetzung von Abschnitten.
Du kannst das Tool auf GitHub finden und es in Aktion sehen.
MinT-Übersetzungsdienst für 55 neue Wikipedias verfügbar, verdoppelt den Inhalt und steht an zweiter Stelle bei der Nutzung
Der neue maschinelle Übersetzungsdienst MinT, der nun zum ersten Mal 55 Wikipedias mit maschineller Übersetzung versorgt, hat einen positiven Einfluss auf die Wikimedia-Communities gehabt. Durch diese umfassende sprachliche Unterstützung haben sich die veröffentlichten Übersetzungen fast verdoppelt, und die mit MinT erstellten Artikel haben eine niedrige Löschquote (1,72%). MinT wird nun in 8% der mit Content Translation veröffentlichten Übersetzungen verwendet und ist damit in nur wenigen Monaten zum zweithäufigsten Übersetzungsdienst in der Wikipedia geworden, nach Google Translate.
Offener Spracherkennungsdienst jetzt für über 200 Sprachen verfügbar
Das Sprachenteam hat einen offenen Spracherkennungsdienst eingerichtet, der automatisch die Sprache erkennt, in der ein bestimmter Text geschrieben ist, um die Interaktion der Benutzer/innen mit den Wikimedia Plattformen zu vereinfachen. Der Dienst unterstützt die Erkennung von 201 Sprachen, und jeder kann auf die API zugreifen, um den Dienst zu nutzen. Gegenwärtig laufen die abschließenden Prüfungen des Dienstes und die Evaluation seiner Belastbarkeit.
Wikisource erkennt jetzt handschriftliche Texte mit Transkribus
Die OCR-Engine von Transkribus erkennt jetzt auch handschriftliche Texte auf Wikisource. Transkribus, eine KI-gestützte Plattform, vereinfacht den Umgang mit handgeschriebenen oder gedruckten Manuskripten, indem sie verschiedene Modelle anbietet, die auf unterschiedliche Schreibschriften, historische Epochen und andere Faktoren zugeschnitten sind. Die Transkribus-Engine ist jetzt als Option neben Google und Tesseract verfügbar und wird derzeit für die auf dieser Seite aufgeführten Wikisources eingesetzt.
Vereinheitlichtes Dashboard für die Übersetzung von Abschnitten für Benutzer/innen auf dem Desktop und auf dem Handy
Das Sprachenteam arbeitet aktiv an der Einführung eines einheitlichen Dashboards für die Übersetzung von Abschnitten für Benutzer/innen auf dem Desktop und auf dem Handy. Ursprünglich wurde das Dashboard in Content Translation für Mobilgeräte entwickelt. Jetzt wird es als einheitliches Dashboard für verschiedene Plattformen weiterentwickelt und bietet eine verbesserte Übersetzungsumgebung. Derzeit befindet es sich in der Beta-Phase. Du kannst es im Wikipedia-Testwiki oder in jedem anderen Wiki mit Abschnittsübersetzung mit dem URL-Parameter “unified-dashboard=true” testen (z. B. https://ig.wikipedia.org/wiki/Special:ContentTranslation?unified-dashboard=true).
Dieses vereinheitlichte Dashboard bietet ein nahtloses, plattformübergreifendes Übersetzungserlebnis. Benutzer/innen können die Übersetzung auf ihrem Desktop beginnen und auf einem mobilen Gerät fortsetzen oder umgekehrt. Es unterstützt auch die Übersetzung von Abschnitten auf dem Desktop, so dass Benutzer/innen geräteübergreifend flexibel sind.
Community-Versammlungen und Veranstaltungen
- Die nächste Community-Versammlung findet am Mittwoch, den 21. Februar, von 12:00 bis 13:00 Uhr UTC statt. Wenn du daran teilnehmen möchtest, melde dich über den angegebenen Link an. Möchtest du ein technisches Update über dein Projekt veröffentlichen? Dann füge es dem Abschnitt “Technische Updates” in der Tagesordnung hinzu.
- Falls du die erste Community-Versammlung im November 2023 verpasst hast, kannst du das nachholen, indem du dir die Videoaufzeichnung ansiehst und die Notizen liest.
Mach mit
- Wenn du auf der Suche nach technischen Aufgaben bist, sieh dir die einfachen Aufgaben an, die noch nicht in den verschiedenen Repositories der Sprachprojekte auf Wikimedia Phabricator vergeben wurden.
- Wenn du nach Tools zum Bearbeiten und Übersetzen von Artikeln und Interface-Nachrichten suchst, kannst du das Content Translation und das Special:Translate-Tool auf Translatewiki.net nutzen. Diese Tools erleichtern die Arbeit mit Inhalten in verschiedenen Sprachen.
- Melde dein Feedback auf den Diskussionsseiten der Sprachtools.
Bleib dran für die nächste Version! Du kannst dich für diesen Newsletter anmelden.
Can you help us translate this article?
In order for this article to reach as many people as possible we would like your help. Can you translate this article to get the message out?
Start translation