世界の多様な関係を少数のウィキデータプロパティに落とし込む際のためらい

Translate this post

世界には様々な関係が存在する。AさんとBさんとを結ぶ「友達」という関係、Cさんとあるボールペンとを結ぶ「所有」という関係、オーケストラという概念とベルリン・フィルハーモニー管弦楽団とを結ぶ「インスタンス」という関係などなど。それらの関係は曖昧かつ流動的だ。AさんとBさんとの「友達」関係は、たぶんAさんとCさんとの「友達」関係と異なるだろうし、もしかしたらAさんとBさんとの関係が「恋人」に変化することもあるかもしれない。

「世界における関係は、無限に存在します」と宣言するのはあまりに数学的に向こう見ずな態度だが、少なくともウィキデータプロパティの数よりは多く存在すると想定していいだろう。

ウィキデータを編集する際、すなわち、世界の多様な関係を少数のウィキデータプロパティに落とし込む際、私はいつもためらっている。そして「私は今から利便性を得るために情報を捨象するのだ」という覚悟のもと、編集ボタンを押している。

具体例をあげてみよう。私は以前、日本のヴァイオリニストのウィキデータにおける師弟関係を整備したのだが、その際「マスタークラスの受講も、音楽院での師事も、それ以外の形も全て『師匠 (P1066)』プロパティで記述する」という妥協をした。クラシック音楽に明るい方ならおわかりだろうが、マスタークラスによる1度きりの師事と、音楽院における継続的な師事、さらにはアカデミア外の個人的な師事はそれぞれ大きく違う。しかし、私はそれらをまとめて師匠プロパティで記述したのだ。あまりに大雑把である。

もちろん、それらの関係をウィキデータ上で詳しく記述する選択肢もあった。例えば、「マスタークラスで指示した人物」などのプロパティを新設して、それを用いるということもできた。しかし、私はそうしなかった。なぜなら、あまりに細かいプロパティを設定すると、データを検索する際のクエリが複雑になってしまうからだ。漠然と「ヴァイオリニストの師弟関係をウィキデータ・クエリ・サービスで調べてみよう」と思う人が「ひと口に師弟関係といっても、それを意味するプロパティは複数あるから、それらは全部クエリに反映させなきゃ」と判断できるかについて、私は自信がない(あと、そもそもウィキデータ・クエリ・サービスを使おうと決意している時点でもはや「漠然」ではない)。それならば「『師匠』プロパティのみを対象とした検索を行った際にヒットするデータの数」を増やす整備方法の方が妥当ではないかと思ったのだ。

もちろん「SPARQLクエリなんて、今後はLLMが書くことになるんだから、細分化したプロパティで情報を記述した上で、それぞれのプロパティの関係を明示しておけばいいんじゃない?」という意見もあるだろう。しかし、LLMがウェブ上のSPARQLエンドポイントで適切なクエリを実行できるかについては、予断を許さない。実際、ウィキメディア財団が運営するブログ Diff に、2025年7月10日に寄稿した記事「LLMにプロンプトを与えるだけでウィキデータベースのGraphRAG風の処理ができるか実験してみた」で、私はタイトル通りの実験をしたのだが結果はあまり芳しくなかった。限られた計算資源のもと、LLM、特に無料モデルの性能が今後どの程度維持されるかわからない状況で、LLMのSPARQLクエリ作成能力に過度に期待するのは厳しいだろう、と少なくとも私は考えている。

閑話休題。ウィキデータを一言で表すなら「妥協の産物」である。上述のとおり、妥協を迫られる場面は多々生じるので、完璧な編集などはなから諦めている。しかし、幸か不幸か、ウィキデータは世界最大級のリンクト・オープンデータのデータセットの1つとなってしまった。百科事典におけるウィキペディアと同じく「最悪だが一番マシ」な存在と言い換えてもいいだろう。「もっとマシなオルタナティブはないのか」とため息をつきながら、メンテナンスをし続けなければいけない存在なのだ。

そんなわけで、私は今日も妥協をする。より良い世界のために。そして、有限のルールで無限の世界を記述することは、もしかしたら本当にできるのかもしれないという、向こう見ずな期待を胸に。

チューリング・マシン (Raynaudmarc, CC BY-SA 4.0)

Can you help us translate this article?

In order for this article to reach as many people as possible we would like your help. Can you translate this article to get the message out?