Недавно Фонд Викимедиа выпустил обновление Политики охранных списков стран и территорий – перечня стран и территорий, по которым мы ограничиваем публикацию данных в целях конфиденциальности. В Фонде Викимедиа мы стремимся обеспечить людям возможности для участия в движении за свободные знания без обнародования личной информации. По этой причине наши проекты сознательно собирают очень небольшое количество личной информации, а любая собранная информация хранится в течение минимально возможного периода времени. Наивысшим приоритетом наших целей является обеспечение безопасной онлайн-среды для нашего сообщества читателей, редакторов и администраторов.
Помимо нашей приверженности к обеспечению конфиденциальности, мы также убеждены, что прозрачность и открытый доступ являются основополагающими ценностями Движения Викимедиа. Тем не менее в прошлом при публикации определенных видов данных возникали обоснованные опасения по поводу конфиденциальности. Любая публикация агрегированных исходных данных из уязвимых стран и территорий обладает потенциалом непреднамеренного раскрытия чьего-либо местоположения или деятельности. Политика охранных списков стран и территорий (CTPL) была первоначально введена в 2019 году для уменьшения данных рисков. Это ограничительный список стран и территорий, по которым мы не публикуем данные в целях снижения рисков конфиденциальности. Первый вариант ограничительного списка был разработан на основе независимой информации, предоставленной панелями профильных экспертов, путем создания составного рейтинга от Фридом Хаус и Репортеров без границ с исключением стран или территорий, находящихся внизу рейтинга. Начиная с 2019 года данное смягчение рисков позволило публиковать ежемесячные открытые выпуски географических данных по редакторам и далее визуализировать их в таких инструментах, как Wikistats. С тех пор, как мы стали публиковать все большее количество данных с географической привязкой, охранный список стран стал фактическим стандартом.
Начиная с 2021 года Фонд Викимедиа стал применять в отношении определенных выпусков данных дифференцированную конфиденциальность. Этот статистический прием позволяет нам количественно оценить и четко ограничить риски конфиденциальности для затрагиваемых лиц при каждой отдельной публикации исходных данных. Эти новые возможности повлекли за собой обновление Политики охранных списков стран и территорий. В результате применения дифференцированной конфиденциальности, данное обновление CTPL позволяет достичь баланса между прозрачностью и приватностью, одновременно расширяя возможности Фонда Викимедиа в отношении публикации информации и сохраняя доступным для каждого участие в онлайн-проектах.
Что изменилось?
Самым большим изменением в данной редакции Политики охранных списков стран и территорий является отход от бинарной классификации стран и территорий. В прошлом, если страна или территория находилась в нижней части рейтинга ежегодного отчета Фридом Хаус или Репортеров без границ, Фонд Викимедиа вносил ее в список CTPL и не публиковал о ней данные. Теперь же Фонд Викимедиа будет рассматривать рейтинги каждой отдельной страны или территории из этих отчетов и осуществлять сортировку согласно схеме оценки рисков, не являющейся бинарной.
В результате данной оценки рисков получаются четыре категории: низкий риск, средний риск, высокий риск и отсутствие публикации. Публикация статистики по странам и территориям с низким риском может осуществляться, как и раньше, без дифференцированной конфиденциальности. Публикация статистики по странам со средним и высоким риском, которая раньше не публиковалась, теперь может осуществляться с применением дифференцированной конфиденциальности. Политика CTPL задает точные и консервативные рамки в отношении публикации данных по этим странам и территориям, чтобы риски конфиденциальности для пользователей были минимальны. Наконец, есть небольшая группа стран и территорий, данные по которым не публикуются в целях безопасности, даже с использованием дифференцированной конфиденциальности.
Градация рисков позволяет учесть больше нюансов в рамках оценки выпускаемой информации, что в перспективе позволит безопасно публиковать больше данных на платформе Википедии. Мы надеемся, что в течение нескольких следующих месяцев данная политика даст возможность публиковать частичные географические данные по редакторам, данные по просмотрам, данные по задержкам передачи и др.
В следующем разделе мы более подробно рассмотрим результаты ежемесячного выпуска географических данных по редакторам – первого массива данных, соответствующего новой Политике охранных списков.
Тематическое исследование: Русская Википедия
Согласно предыдущей версии политики CPL, Фонд Викимедиа не публиковал данные о нескольких странах, где широко используется русский язык. Новая версия политики позволяет публиковать эту информацию со строгими гарантиями конфиденциальности. Это означает, что в Русской Википедии произойдут большие изменения в плане доступности данных.
Ниже мы сделали визуализацию этих данных. Например, здесь представлена помесячная GIF-визуализация данных по общему количеству редакторов Русской Википедии в каждой стране. Обратите внимание, что шкала справа является логарифмической – это означает, что верхняя отметка – порядка ~35,000 редакторов, а нижняя – 1 редактор.
Мы также подготовили серию линейных графиков, где показано сравнение активности редакторов с течением времени в девяти сообществах Русской Википедии. Снова обратите внимание, что шкала оси y является логарифмической. Мы также обозначили порог публикации для каждой страны в виде серой прерывистой линии – данное значение показывает отметку, ниже которой мы не будем публиковать данные. Это варьируется в зависимости от показателя риска для каждой страны: низкого, среднего или высокого.
Недавнее обновление Охранного списка стран и территорий позволит нам публиковать больше данных в соответствии с ценностями прозрачности, которыми мы так дорожим в Фонде Викимедиа, минимизируя дополнительные риски безопасности и конфиденциальности для наших участников, редакторов и администраторов. Наши проекты не смогли бы функционировать без каждодневной работы наших участников-волонтеров, и в результате данного обновления политики будет опубликовано больше информации, чтобы помочь нашим волонтерам в их глобальной деятельности. Мы стремимся обеспечить людям возможности для участия в движении за свободные знания без обнародования личной информации и предоставить безопасную онлайн-среду для наших читателей, редакторов и администраторов.
Эллен Магальянес является старшим юристом Фонда Викимедиа, а Хал Тридман – ведущим инженером по защите персональных данных Фонда Викимедиа.
Can you help us translate this article?
In order for this article to reach as many people as possible we would like your help. Can you translate this article to get the message out?
Start translation