本を読みながらウィキデータを整備する

2024年3月、ウクライナに関する論考を読みながらウィキデータをチマチマと整備したので、その模様を簡単にレポートします。ウィキデータの編集に興味がある方や、本で得た知識を何かしらの形で活用したいと考えている方のお役に立てば幸いです。また、ウィキデータに慣れ親しんだ方が、その編集記・活用記を作成するきっかけとなれば望外の喜びです。

ヘラルト・ドウ『読書をする老婦人』(パブリックドメイン)

ウィキデータとは

ウィキデータとは、ウィキメディア財団が運営するプロジェクトの一つで、「人間とコンピューターの双方が平等に参照・編集できるフリーかつオープンな知識データベースサイト」と説明されています(メインページより)。ものすごく大雑把に言えば、メタデータ集です。

例えば、ウィキデータ上の「大谷翔平」という項目には、大谷の分類が「ヒト」であること、その出身地が「水沢市」であること、その職業が「野球選手」であること、大谷翔平のアメリカ議会図書館典拠管理識別子は「n2018042957」であることなどがまとめられています。大谷のような人物に限らず「ぬいぐるみ」「激おこぷんぷん丸」「焼肉」などのウィキデータ項目も存在します。

これらの情報は、ウィキペディア同様ボランティアたちが整備しています。詳しく知りたい方は「Wikidata:はじめに」というページをご覧ください。

ウィキデータのロゴ。(Kambai Akau, CC BY-SA 4.0)

ウィキペディアンとして抱えていた悩み

私はボランティアとして主にウィキペディア記事を執筆しています。ウィキペディア記事における記述は参考文献を明示する必要があるため、記事を書くときは関連資料を図書館から調達したり、本屋で買ったりしているのですが、いつからか、全く関係ない本を読んでいるときも「この記述はウィキペディア記事『○○』に役立ちそうだから、後で反映しておこう」と思うようになりました。

しかし、それが上手くいかないことも多々あります。具体的には、当該記述を追加したいウィキペディア記事が存在しない場合です。

例えば、読んでいる本に「アントン・ホニャララ(注:架空の人物です)は無名の作家だが、作家たちの間では天才として知られており、あのドストエフスキーもホニャララを絶賛していた」という記述を見つけた場合、私は「アントン・ホニャララ」のウィキペディア記事に「ドストエフスキーはホニャララを絶賛していた」という記述を追加しようと試みるのですが、これは「アントン・ホニャララ」のウィキペディア記事が存在しない場合、実行不可能です。もちろん、その場合は私が日本語版ウィキペディアに「アントン・ホニャララ」の記事を立項すればいいのですが、記事の立項はそこそこ時間がかかるので、ついつい後回しに。結果、放置してしまうのです……。

ウィキデータの整備なら圧倒的に楽

そんなある日、ふと「加筆すべきウィキペディア記事が存在せず、新規立項も時間の都合上無理なら、せめてウィキデータだけでも整備すればいいんだ」と気が付きました。具体的には「読んだ本に登場した単語等(主に外来語)を、ウィキデータ項目のラベルに記入する作業ならば、ものすごく簡単に処理できるな」と感じました。

実例を紹介しましょう。書籍『ウクライナを知るための65章』に収録された、原田義也「ウクライナを愛した女性たち」という論考を読んでいたところ、私が知らない女性芸術家が何人か紹介されていました。具体的には、ナターリヤ・コブリンスカ、オレーナ・プチールカなどです。彼女らの記事は日本語版ウィキペディアに存在せず、ナターリヤ・コブリンスカに至っては、Google検索で日本語資料がほとんどヒットしない状況でした(2024年3月21日時点)。しかし、ウィキデータ項目は存在しました。

上述の「Wikidata:はじめに」にも示されているとおり、ウィキデータは項目(items)からなり、それぞれにラベル(label)、説明(description)と任意の数の別名(aliases)があります。「ラベル」とはその項目の最も知られる名前で、言語ごとに記入されます。

文章で説明してもわかりにくいので、ウィキデータ項目「大谷翔平」の例を示します。

言語ラベル説明別名
日本語大谷翔平日本のプロ野球選手
英語Shohei OhtaniJapanese professional baseball player, MLB player (1994-)Shohei Otani

Shōhei Ōtani

Ohtani Shohei

Otani Shohei

Ōtani Shōhei
ウィキデータ「大谷翔平」2024年3月21日 (木) 05:51 (UTC) 版を‎参照して筆者が作成。

話をウクライナの女性芸術家に戻しましょう。先述のとおり、彼女らのウィキデータ項目は存在していました。しかし、その日本語ラベルは記入されていませんでした。そこで、私が読んでいた論考に記載されていた日本語表記を、それぞれのラベルに記入していきました。成果は以下のとおりです。

何の役に立つのか

翻訳をしたことがある方はご存知かと思いますが、世の中には「日本語に翻訳されたことがない言葉」がたくさん存在します。また、日本語に翻訳されたことがある場合でも、それが掲載されている資料を探し当てることが困難なケースがままあります。そのため、我々ウィキペディアンも、日本語以外の参考文献を読んだ際に「『Désiré Defauw』って日本語でどうやって表記するんだ……?」などと悩むのです。

こんな時にウィキデータのラベルは役立ちます。つまり、日本語でどのように表記されるかわからないトピックに対応するウィキデータ項目のラベルを参照すれば、日本語表記の一例を知ることができるのです。これはウィキペディアンに限らず、外国語学習者や翻訳者にとっても有用でしょう。

上述の例で言えば、ウィキデータで「Désiré Defauw」と検索すると「デジレ・デフォー (Q2915399)」の項目が表示され、日本語表記は主に「デジレ・デフォー」であること、そして「デジレ・ドゥフォー」とも表記されることを知ることができます。

(余談ですが、日本語以外の言語で書かれた参考資料を用いてウィキペディアの記事を編集する場合、どうしても「今まで一度も日本語に訳されていなかった単語」の日本語表記を作り出さなければいけないことがあります。日本語版ウィキペディアの「Wikipedia:外来語表記法」などを読むと、その苦労を垣間見ることができます……)

出典を一応ノートにつけておく

ウィキデータのラベルには出典を付与することができないのですが、今回追加した項目のラベルについては一応出典をつけておいた方がいいなと思ったので(ウクライナに関する項目の日本語表記については様々な議論があるため)、ノートで参考文献を示しておきました。具体的には以下のとおりです。

日本語ラベル「オレーナ・テリーハ」については、下記資料を参照しています。参考までにお知らせいたします。

  • 原田義也「ウクライナを愛した女性たち」『ウクライナを知るための65章』明石書店、2018年、198頁。ISBN 978-4-7503-4732-5

Eugene Ormandy (トーク16:16, 21 March 2024 (UTC)[返信]

ウィキデータ [[Talk:Q2620289]] 2024年3月21日 (木) 16:16 (UTC)‎ 版より引用。

余談ですが、出典に対する意識はウィキメディア・プロジェクトごとに多少異なるのかなと個人的には感じています。いつか本腰を入れて分析したいところです。

まとめ

本を読みながらウィキデータのラベルを整備した事例についてご紹介しました。ウィキデータに興味を持っていただけるきっかけとなれば幸いです。そして、私のような「アウトプットの機会がなければインプットをしない」面倒くさがりの同士たちが、本稿をきっかけとして本を手に取ってくれたら大変嬉しいです。

また、ウィキデータに慣れ親しんだ皆様にはぜひ、本稿のようなウィキデータ編集記・活用記を作成していただきたいなとも感じております。ウィキデータというプロジェクトの可能性を探り、その歴史を分析する上で役立つ資料となると思うので。

No comments

Comments are closed automatically after 21 days.