VZP10224です。Wikidataと、その関連ツールを紹介する際に、エンジニアやウィキメディアにかかわる人ではない多数の方に、Wikidataの説明をすることを目的に、この記事を書きます。7月27日のオープンソースカンファレンス2024Kyotoのセミナーや展示ブースで来場者に説明した内容は、この記事の内容に説明の都度若干のアレンジを加えたものです。
日本語版Wikipediaの記事の中で、記事数や内容の充実度が優れているジャンルの一つに、競馬・競走馬関連があります。執筆に際し、記事を作成するための資料がデータとしてそろっており(血統・競争成績・競争成績に対する講評など)、ウィキペディアの求める基準を満たす記事を作成しやすいことや、編集者相互間での見解の違いが少ない、というのがあるのではないかと推察しております。実際、2024年8月1日時点で、秀逸な記事に競馬関連で競走馬4頭(オグリキャップ、サンデーサイレンス、テンポイント、ナリタブライアン)、騎手1名(岡部幸雄)、レース1つ(天皇賞)、競馬場1つ(池上競馬場)と、合計7記事が選出されています。そのほか良質な記事には27の記事が選出されています。
競走馬にとって血統はとても大事。競馬ファンにとっては馬券を的中させるために、また馬主にとってもどのレースで走らせれば勝つこと(=より多くの賞金を獲得)ができるかを考えるときに、血統は重要な指標となります。実際の競走馬の血統表は様々な手段で公開されていますし、単なるデータであれば著作権は発生しない。であれば、Wikidataでも同じように血統表が作成できるのではないか、と考えて、Eugene Ormandyさん作成のいろいろな記事(その1、その2)を参照して、Wikidata Graph Builderを使用して作成しようとしました。
まずは日本語をセットして、
Traversal propertyには「P22」を入力。「父」のプロパティがセットされます。
Root itemには、中心にしたい競走馬の名前を入力します。下のスクリーンショットでは「ウマ娘」なる文字が見えますが、ここでは華麗にスルー(後で説明します)。
とりあえず「Build」を押して実行。
Rootの競走馬を起点に「父」をたどっていくツリーが出来上がりました。
Modeを「Reverse」にすると、Rootを頂点とする子供のツリーが出来上が・・・らずに、子供1世代しかたどれないツリーとなります。
では、「父」をたどるのではなく、「子供」をたどってみましょう。Traversal propertyに「P40」をセット。
実行すると、「子供」をキーにしたツリーが出来上がります。
種牡馬として日本の競馬界を席巻したサンデーサイレンスで同じことをやると、えらいことになります。もはや文字が確認できません。
ちなみに、メジロマックイーンのWikidataの項目を開くと、「以下と異なる」というプロパティが存在し、項目は同じく「メジロマックイーン」の文字が。これをクリックすると、
先ほどちらりと見えた、「ウマ娘プリティダービー」の登場キャラクタの項目が出現します。Wikipediaの記事としてはどこにも作成されていないのに、設定されているプロパティは思いのほか充実しています。なおウィキメディア・コモンズには、関連する写真を収録したカテゴリがある模様。
なお、2024年8月9日時点で、Wikidataのメジロマックイーン(競走馬)の項目には「母」のプロパティが設定されていません。これは日本語版Wikipediaで、母に当たる「メジロオーロラ」の記事が存在していないためと考えられます。しかし、Wikidataのプロパティに、Wikipediaに存在しない値を設定しなくてもよい、というのは、先ほどの「メジロマックイーン(ウマ娘)」の項目の存在からも明らか。メジロオーロラに必要なデータをWikidataに投入できる方、ぜひ作成してください。
Can you help us translate this article?
In order for this article to reach as many people as possible we would like your help. Can you translate this article to get the message out?
Start translation