Kürzlich hat die Wikimedia Foundation die Richtlinie zur Länder- und Gebietsschutzliste aktualisiert, eine Liste von Ländern und Gebieten, für die wir die Veröffentlichung von Daten aus Datenschutzgründen einschränken. Die Wikimedia Foundation setzt sich dafür ein, dass Menschen am Freies Wissen Movement teilnehmen können, ohne persönliche Daten angeben zu müssen. Deshalb sammeln unsere Projekte bewusst nur sehr wenige personenbezogene Daten, und die erhobenen Daten werden so kurz wie möglich aufbewahrt. Die Gewährleistung einer sicheren Online-Umgebung für unsere Community aus Leser/innen, Autor/innen und Administrator/innen ist für uns von zentraler Bedeutung.
Neben unserem Engagement für den Datenschutz sind wir auch der Meinung, dass Transparenz und offener Zugang zu den Grundwerten des Wikimedia Movements gehören. Nichtsdestotrotz gab es in der Vergangenheit sehr berechtigte Bedenken hinsichtlich der Freigabe bestimmter Daten. Jede Freigabe von aggregierten Rohdaten aus sensiblen Ländern und Gebieten birgt das Potenzial, versehentlich den Standort oder die Aktivität einer Person zu verraten. Die Richtlinien der Country and Territory Protection List (CTPL) wurden 2019 entwickelt, um dieses Risiko zu mindern. Es handelt sich dabei um eine Blockliste von Ländern und Gebieten, für die wir keine Daten veröffentlichen, um die Privatsphäre zu schützen. Die erste Version dieser Blockliste wurde auf der Grundlage unabhängiger Daten entwickelt, die von Expert/innen zur Verfügung gestellt wurden. Dazu wurde eine zusammengesetzte Bewertung von Freedom House und Reporter ohne Grenzen erstellt und Länder oder Gebiete, die in der niedrigsten Kategorie lagen, ausgeschlossen. Seit 2019 ermöglicht diese Entschärfung, dass die öffentlichen monatlichen Daten der Geoeditoren veröffentlicht und anschließend in Tools wie Wikistats visualisiert werden können. Da wir seither immer mehr geolokalisierte Daten veröffentlicht haben, wurde die Länderschutzliste zu einem De-facto-Standard.
Seit 2021 setzt die WMF bei einigen Datenfreigaben den differenzierten Datenschutz ein. Diese statistische Technik ermöglicht es uns, das Datenschutzrisiko einer bestimmten Datenfreigabe für die Personen im Rohdatensatz sowohl zu quantifizieren als auch streng einzugrenzen. Diese neuen Möglichkeiten haben zu einem Update der Richtlinie über die Länder- und Gebietsschutzliste geführt. Durch die Anwendung des differenzierten Datenschutzes ermöglicht uns dieses Update der CTPL, ein Gleichgewicht zwischen Transparenz und Datenschutz zu finden und gleichzeitig die Fähigkeit der WMF zu verbessern, Informationen zu veröffentlichen und die Fähigkeit aller zu bewahren, online zu unseren Projekten beizutragen.
Was hat sich geändert?
Die größte Änderung in dieser Version der Richtlinie über die Länder- und Gebietsschutzliste ist die Abkehr von der binären Kategorisierung von Ländern und Gebieten. Wenn ein Land oder Territorium im Jahresbericht von Freedom House oder Reporter ohne Grenzen in die niedrigste Kategorie eingestuft wurde, setzte die WMF das Land auf die CTPL und veröffentlichte keine Daten darüber. Künftig wird die WMF die Bewertungen der einzelnen Länder und Gebiete in diesen Berichten betrachten und sie in ein nicht binäres Risikokonzept einordnen.
Das Ergebnis dieser Risikoberechnung sind vier Kategorien: geringeres Risiko, mittleres Risiko, höheres Risiko und nicht veröffentlicht. Statistiken über Länder und Gebiete mit geringeren Risiken bei der Veröffentlichung von Daten können wie bisher veröffentlicht werden, ohne dass der Datenschutz beeinträchtigt wird. Statistiken über Länder mit mittlerem und höherem Risiko im Zusammenhang mit der Veröffentlichung von Daten, die bisher nicht veröffentlicht wurden, können nun mit differenziertem Datenschutz veröffentlicht werden. Die Richtlinien der CTPL legen strenge und konservative Grenzen für die Veröffentlichung von Daten über diese Länder und Gebiete fest, um sicherzustellen, dass die Risiken für die Privatsphäre der Benutzer/innen gering sind. Schließlich gibt es noch eine kleinere Gruppe von Ländern und Gebieten, die aus Sicherheitsgründen nicht veröffentlicht werden, auch nicht unter Anwendung des differenzierten Datenschutzes.
Diese Abstufung des Risikos ermöglicht eine differenziertere Evaluation der Datenveröffentlichungen und sollte letztlich die sichere Veröffentlichung von mehr Daten der Wikimedia Plattformen ermöglichen. Wir hoffen, dass wir diese Richtlinie in den nächsten Monaten nutzen können, um die Veröffentlichung von detaillierten Geoeditor-Daten, Seitenaufrufdaten, Latenzdaten und mehr zu ermöglichen.
Im nächsten Abschnitt werden wir einige der Ergebnisse aus der monatlichen Veröffentlichung der differentiellen privaten Geoeditoren vorstellen, dem ersten Datensatz, der bald mit der neuen CTPL-Richtlinie konform sein wird.
Fallstudie: Russische Wikipedia
In der vorherigen Version der CTPL-Richtlinie gab die WMF keine Daten über mehrere Länder frei, in denen Russisch weit verbreitet ist. Die neue Version der Richtlinie erlaubt es uns, diese Daten mit strengen Datenschutzgarantien freizugeben. Das bedeutet, dass die russische Wikipedia eine große Änderung in der Menge der sichtbaren Daten erfahren wird.
Wir haben einige dieser Daten unten visualisiert. Hier siehst du zum Beispiel die Gesamtzahl der Autor/innen in der russischen Wikipedia für jedes Land im Monatsvergleich. Beachte, dass die Skala auf der rechten Seite logarithmisch ist – das bedeutet, dass das obere Ende in der Größenordnung von ~35.000 Bearbeiter/innen liegt und das untere Ende bei 1 Bearbeiter/in.
Wir haben auch eine Reihe von Liniendiagrammen erstellt, die die Aktivität von neun Communities russischer Autor/innen in der Wikipedia im Zeitverlauf vergleichen. Auch hier ist die y-Achse logarithmisch skaliert. Außerdem haben wir die Freigabeschwelle für jedes Land als gepunktete graue Linie dargestellt – dieser Wert repräsentiert die Zahl, unter der wir keine Daten veröffentlichen, und variiert je nachdem, ob das Land ein geringes, mittleres oder hohes Risiko darstellt.
Dieses neueste Update der Länder- und Gebietsschutzliste ermöglicht es uns, mehr Daten zu veröffentlichen, die dem Wert der Transparenz entsprechen, den wir bei der Wikimedia Foundation so sehr schätzen, und zwar auf eine Weise, die zusätzliche Sicherheits- und Datenschutzrisiken für unsere Beitragenden, Autor/innen und Admins minimiert. Unsere Projekte könnten ohne die tägliche Arbeit unserer freiwilligen Beitragenden nicht funktionieren, und mit diesem Update der Richtlinien werden wir mehr Informationen veröffentlichen, um unsere Freiwilligen bei dieser globalen Arbeit zu unterstützen. Wir setzen uns weiterhin dafür ein, dass Menschen am Freies Wissen Movement teilnehmen können, ohne persönliche Daten preisgeben zu müssen, und dass unsere Leser/innen, Autor/innen und Administrator/innen eine sichere Online-Umgebung vorfinden.
Ellen Magallanes ist Senior Counsel bei der Wikimedia Foundation und Hal Triedman ist Senior Privacy Engineer bei der Wikimedia Foundation.
Can you help us translate this article?
In order for this article to reach as many people as possible we would like your help. Can you translate this article to get the message out?
Start translation