Конфиденциальность и прозрачность: Обновление политики в отношении охранных списков стран и территорий

Недавно Фонд Викимедиа выпустил обновление Политики охранных списков стран и территорий – перечня стран и территорий, по которым мы ограничиваем публикацию данных в целях конфиденциальности. В Фонде Викимедиа мы стремимся обеспечить людям возможности для участия в движении за свободные знания без обнародования личной информации. По этой причине наши проекты сознательно собирают очень небольшое количество личной информации, а любая собранная информация хранится в течение минимально возможного периода времени. Наивысшим приоритетом наших целей является обеспечение безопасной онлайн-среды для нашего сообщества читателей, редакторов и администраторов.       

Помимо нашей приверженности к обеспечению конфиденциальности, мы также убеждены, что прозрачность и открытый доступ являются основополагающими ценностями Движения Викимедиа. Тем не менее в прошлом при публикации определенных видов данных возникали обоснованные опасения по поводу конфиденциальности. Любая публикация агрегированных исходных данных из уязвимых стран и территорий обладает потенциалом непреднамеренного раскрытия чьего-либо местоположения или деятельности. Политика охранных списков стран и территорий (CTPL) была первоначально введена в 2019 году для уменьшения данных рисков. Это ограничительный список стран и территорий, по которым мы не публикуем данные в целях снижения рисков конфиденциальности. Первый вариант ограничительного списка был разработан на основе независимой информации, предоставленной панелями профильных экспертов, путем создания составного рейтинга от Фридом Хаус и Репортеров без границ с исключением стран или территорий, находящихся внизу рейтинга. Начиная с 2019 года данное смягчение рисков позволило публиковать ежемесячные открытые выпуски географических данных по редакторам и далее визуализировать их в таких инструментах, как Wikistats. С тех пор, как мы стали публиковать все большее количество данных с географической привязкой, охранный список стран стал фактическим стандартом.

Начиная с 2021 года Фонд Викимедиа стал применять в отношении определенных выпусков данных дифференцированную конфиденциальность. Этот статистический прием позволяет нам количественно оценить и четко ограничить риски конфиденциальности для затрагиваемых лиц при каждой отдельной публикации исходных данных. Эти новые возможности повлекли за собой обновление Политики охранных списков стран и территорий. В результате применения дифференцированной конфиденциальности, данное обновление CTPL позволяет достичь баланса между прозрачностью и приватностью, одновременно расширяя возможности Фонда Викимедиа в отношении публикации информации и сохраняя доступным для каждого участие в онлайн-проектах.

Что изменилось?

Самым большим изменением в данной редакции Политики охранных списков стран и территорий является отход от бинарной классификации стран и территорий. В прошлом, если страна или территория находилась в нижней части рейтинга ежегодного отчета Фридом Хаус или Репортеров без границ, Фонд Викимедиа вносил ее в список CTPL и не публиковал о ней данные. Теперь же Фонд Викимедиа будет рассматривать рейтинги каждой отдельной страны или территории из этих отчетов и осуществлять сортировку согласно схеме оценки рисков, не являющейся бинарной. 

В результате данной оценки рисков получаются четыре категории: низкий риск, средний риск, высокий риск и отсутствие публикации. Публикация статистики по странам и территориям с низким риском может осуществляться, как и раньше, без дифференцированной конфиденциальности. Публикация статистики по странам со средним и высоким риском, которая раньше не публиковалась, теперь может осуществляться с применением дифференцированной конфиденциальности. Политика CTPL задает точные и консервативные рамки в отношении публикации данных по этим странам и территориям, чтобы риски конфиденциальности для пользователей были минимальны. Наконец, есть небольшая группа стран и территорий, данные по которым не публикуются в целях безопасности, даже с использованием дифференцированной конфиденциальности. 

Градация рисков позволяет учесть больше нюансов в рамках оценки выпускаемой информации, что в перспективе позволит безопасно публиковать больше данных на платформе Википедии. Мы надеемся, что в течение нескольких следующих месяцев данная политика даст возможность публиковать частичные географические данные по редакторам, данные по просмотрам, данные по задержкам передачи и др. 

В следующем разделе мы более подробно рассмотрим результаты ежемесячного выпуска географических данных по редакторам – первого массива данных, соответствующего новой Политике охранных списков.   

Тематическое исследование: Русская Википедия

Согласно предыдущей версии политики CPL, Фонд Викимедиа не публиковал данные о нескольких странах, где широко используется русский язык. Новая версия политики позволяет публиковать эту информацию со строгими гарантиями конфиденциальности. Это означает, что в Русской Википедии произойдут большие изменения в плане доступности данных. 

Ниже мы сделали визуализацию этих данных. Например, здесь представлена помесячная GIF-визуализация данных по общему количеству редакторов Русской Википедии в каждой стране. Обратите внимание, что шкала справа является логарифмической – это означает, что верхняя отметка – порядка ~35,000 редакторов, а нижняя – 1 редактор.

Мы также подготовили серию линейных графиков, где показано сравнение активности редакторов с течением времени в девяти сообществах Русской Википедии. Снова обратите внимание, что шкала оси y является логарифмической. Мы также обозначили порог публикации для каждой страны в виде серой прерывистой линии – данное значение показывает отметку, ниже которой мы не будем публиковать данные. Это варьируется в зависимости от показателя риска для каждой страны: низкого, среднего или высокого.

Недавнее обновление Охранного списка стран и территорий позволит нам публиковать больше данных в соответствии с ценностями прозрачности, которыми мы так дорожим в Фонде Викимедиа, минимизируя дополнительные риски безопасности и конфиденциальности для наших участников, редакторов и администраторов. Наши проекты не смогли бы функционировать без каждодневной работы наших участников-волонтеров, и в результате данного обновления политики будет опубликовано больше информации, чтобы помочь нашим волонтерам в их глобальной деятельности. Мы стремимся обеспечить людям возможности для участия в движении за свободные знания без обнародования личной информации и предоставить безопасную онлайн-среду для наших читателей, редакторов и администраторов.       

Эллен Магальянес является старшим юристом Фонда Викимедиа, а Хал Тридман – ведущим инженером по защите персональных данных Фонда Викимедиа.

No comments

Comments are closed automatically after 21 days.