稲門ウィキペディアン会の Eugene Ormandy です。本稿では、ウィキメディア・プロジェクトを活用した言語保存活動について概観します。
保存したい言語のウィキペディアを立ち上げる
ウィキメディア・プロジェクトを用いた言語保存活動のうち、代表的なものはやはり、保存したい言語が用いられたウィキペディアを立ち上げることでしょう。つまり「○○語版ウィキペディア」を立ち上げるということです。
新しいウィキペディア言語版を作るためには、インキュベーターというプロジェクトでの合意が必要となります。インキュベーターでの議論の進め方については、中央ドゥスン語版ウィキペディアの設立に携わった Jjurieee さんのブログ記事 “Launch of the Kadazandusun Language Wikipedia: A Milestone in Preserving Indigenous Heritage” が参考になるでしょう。この記事では、マレーシアの学生ウィキメディア団体「ケント・ウィキ・クラブ」が果たした役割なども紹介されています。
なお、インキュベーターでの議論が常にうまくいくとは限りません。例えば、2024年9月にイスタンブルで開催された国際会議 “Wikimedia CEE Meeting 2024” では、モンテネグロ語ユーザーのウィキメディアンが “How to Overcome Small Community Struggles that Wikimedia Chooses to Ignore: The Case of Montenegrin Wikipedia” というプレゼンテーションを行い、その厳しい状況について発信しました。
ウィキメディア・コモンズに発音等の音声ファイルをアップロードする
画像や音声ファイル、動画等をアーカイブするプロジェクト「ウィキメディア・コモンズ」に、保存したい言語の音声ファイルや、その言語が用いられたお祭り等の写真・動画をアップロードするという試みもあります。
このような活動に取り組む著名なウィキメディアンとしては、2021年にウィキメディアン・オブ・ザ・イヤー新人賞を受賞した Carma Citrawati さんが挙げられるでしょう。Carma さんは録音ツール Linga Libre を活用して、バリ語の単語の発音をウィキメディア・コモンズに800以上アップロードしています。また、Carma さんはウィキソースを活用した翻刻活動などもさかんに行なっています。詳しく知りたい方は、下記リンクから確認してみてください。
- Wikimedia Commons [[Category:Lingua Libre pronunciation by Carma citrawati]] – Carma さんによるバリ語の発音集。
- Wikimedia Foundation (15 August 2021) “Meet Carma Citrawati: Wikimedian of the Year 2021 Newcomer of the Year winner” Diff.
ウィクショナリーを整備する
辞書プロジェクト「ウィクショナリー」を活用した言語保存活動もさかんです。ウィクショナリーとは、ざっくり言うと「任意の文字列が各言語で持つ意味を、様々な言語で閲覧できるプロジェクト」です。
例えば日本語版ウィクショナリーの「sada」という項目には、スロヴェニア語、セルビア・クロアチア語、中部ドゥスン語における「sada」の意味が日本語で書かれています(2023年10月7日 (土) 13:13 (UTC) 版)。そして、ウィクショナリーはウィキペディア同様、言語ごとに運営されているプロジェクトなので、英語版に切り替えれば英語の説明が表示されます。なお、言語版ごとに項目の充実度は異なっている点にご注意ください。
ウィクショナリーを言語保存に活用する方法は主に「当該言語の語彙を、他言語版(主に英語版)ウィクショナリーに追加する」「当該言語のウィクショナリーを立ち上げる」という2つがあります。2024年時点の日本ではあまり有名ではないものの、海外では編集イベントもさかんに行われています。なお、このようなイベントを数多く主催するマレーシアの友人タウフィク・ロスマンは「ウィクショナリーはウィキペディアよりも簡単に編集できるから、初心者も参加しやすいんだよね」と指摘しています。
ちなみに、タウフィクはこれらの活動が高く評価され、ウィキメディアン・オブ・ザ・イヤー2023に選出されています。この賞を与えたウィキメディア財団も、言語保存活動に関心を示していることがわかりますね。
ウィキデータを整備する
ウィキデータも言語保存の役に立ちます。ウィキデータとは、ものすごくざっくり言うとメタデータ集です。さらに大雑把に説明すると、ウィキデータは「ことがら」を記述するための QID と、語彙を記述するための LID(語彙データ)に分かれます。詳しく知りたい方は、下記のページや解説記事をご覧ください。
- Wikidata [[Wikidata:はじめに]]
- Wikidata [[Wikidata:語彙データ]]
- 大向一輝「識別子としてのWikidata」『情報の科学と技術』第70 巻第 11 号、2020年、559-562頁。https://doi.org/10.18919/jkg.70.11_559
ウィキデータ (QID)、語彙データ (LID) ともに、編集イベントがしばしば開催されています。イベント参加者たちは、保存したい言語にまつわる「ことがら」を QID に追加したり、その語彙を LID に追加したりしています。
なお、言語とウィキデータをめぐる進行中のプロジェクトとしては「抽象ウィキペディア」もあります。抽象ウィキペディアとは、ウィキデータを活用して、あらゆる言語版のウィキペディア記事を生成するプロジェクトです。つまり、保存したい言語に関するウィキデータを整備しておくことで、その情報を他の言語ユーザーに発信できるようになる可能性や、十分に整備されていない当該言語のウィキペディアを改善できる可能性が生まれるのです。
言語保存に取り組むウィキメディアンたち
上述のとおり、ウィキメディア・プロジェクトはそれぞれ、言語保存のツールとして大きな可能性を秘めています。そして、言語保存のために編集を行うウィキメディアンたちも数多くいます。
ウィキメディアンが集う国際会議でも、言語保存は主要トピックの一つです。ウィキメディア財団が年に一度開催する「ウィキマニア」でも、言語保存に関するセッションはいくつも行われていますし、ウィキメディア・プロジェクトを活用した言語保存そのものをテーマとした国際会議「Celtic Knot」も定期的に開催されています。
まとめ
本稿では、ウィキメディア・プロジェクトを活用した言語保存活動を紹介しました。どなたかのお役に立てば幸いです。なお、勉強不足ゆえ、東南アジア、ヨーロッパ以外の言語保存活動をほとんどピックアップできませんでした。ご容赦いただければ幸いです。識者による補足があれば望外の喜びです。
Can you help us translate this article?
In order for this article to reach as many people as possible we would like your help. Can you translate this article to get the message out?
Start translation