稲門ウィキペディアン会の Eugene Ormandy です。本稿では、ウィキデータ・クエリ・サービスを活用して指揮者たちの楽器経験を調べたプロセスをまとめます。
背景
私はクラシック音楽オタクで、特に指揮者の楽器経験に関心があります。
大抵の指揮者は、何かしらの楽器の演奏に秀でています。中には、ウィーン・フィルハーモニー管弦楽団のニューイヤーコンサートでヴァイオリンの「弾き振り」を披露したロリン・マゼールや、オーケストラに代わりピアノ1台でオペラの伴奏を行ったリッカルド・ムーティのような超人もいます。また、楽器奏者として頂点を極めたのち、指揮者に「転身」する音楽家も一定数いますが、そういった人たちが良い指揮者になるかは残念ながらまた別の話です。
閑話休題。ある日、ふと「オーボエの演奏経験がある指揮者と、チェロの演奏経験がある指揮者って、どっちが多いんだろう」という疑問を抱きました。そこで、ウィキデータ・クエリ・サービスを活用して、大まかな調査を行うことに。また、せっかくなので、ほかの楽器との比較・検討を行うことにしました。
調査プラン立案
調査プランは2つ思い浮かびました。具体的には以下のとおりです。なお、本稿ではウィキデータやウィキデータ・クエリ・サービスに関する初歩的な解説は割愛しますので、気になる方はウィキデータ「Wikidata:はじめに」や「ウィキデータ:SPARQLクエリサービス/ヘルプ」をご確認ください。
- 「プロパティ『職業 (P106)』のバリューが『指揮者 (Q158852)』」かつ「プロパティ『楽器 (P1303)』のバリューが『ピアノ (Q5994)』」のデータを取得し、ヒット数を確認。「ピアノ (Q5994)」の部分は「ヴァイオリン (Q8355)」などに変更し、楽器ごとにヒット数を確認。
- プロパティ「職業 (P106)」のバリューが「指揮者 (Q158852)」かつ「ピアニスト (Q486748)」のデータを取得。「ピアニスト (Q486748)」の部分は「ヴァイオリニスト (Q1259917)」などに変更し、楽器ごとにヒット数を確認。
直感的に、前者の方がうまくいきそうだなと感じました。なぜなら、前者であれば「ピアノを音楽大学で専攻したものの、プロのピアニストとしては活動していない。しかしプロの指揮者として活動している」という指揮者のデータもヒットするからです。
ただ、一介のウィキデータ編集者として「楽器プロパティがきちんと入力されている指揮者エンティティは少ないかもしれない」と思ったのも事実。そこで、一旦テストをしてみることにしました。具体的には、楽器プロパティにヴァイオリンをもつ指揮者のデータを取得し、ヒット数を確認。幸い相当数ヒットしたので、この方向で進めることにしました。
なお、この時点で「『ピアノもヴァイオリンもトランペットも経験した』という指揮者は、それぞれの調査で重複して登場してしまう。分母が増えてしまうので、楽器ごとの人数および割合を算出する作業にあまり意味はないかもしれない」と思ったのですが、今回はお遊びなので細かいことは気にしないことにしました。
調査1
SPARQLクエリを作成するにあたり、「ウィキデータ・クエリ・ビルダー」を活用。条件を入力したのちクエリを取得し、それをウィキデータ・クエリ・サービスで実行しました。
上記で取得したクエリを、下記のとおりウィキデータ・クエリ・サービスで実行。また、楽器の条件を変更しつつクエリを実行してそれぞれのヒット数を確認し、Powerpoint を活用して棒グラフにまとめました。実際の動作および作成したグラフは下記のとおりです。
違和感
上記の結果を見て、私は違和感を覚えました。「ピアノ、ヴァイオリン経験者が多いことは予想どおりだけど、トランペット経験者はここまで多いのかな」と思ったのです。そこで、トランペットの検索結果を改めて確認したところ、ジャズプレイヤーが何人かヒットしていることに気が付きました。
「ジャズプレイヤーで『指揮者』と言われる人はそう多くはないはずなのになぜ?」と思い、データやクエリを確認したところ、答えが見つかったので以下に整理します。なお、繰り返しになりますが、本稿ではウィキデータやSPARQLについての初歩的な解説は割愛しますので、慣れていない方は適宜読み飛ばしてください。
- ヒットしたデータの中には、プロパティ「職業 (P106)」バリューに「バンドマスター (Q806349)」を持つデータが一定数あった。これらのデータはいわゆる「クラシック音楽」畑の音楽家ではない可能性が高い。
- 「バンドマスター (Q806349)」はプロパティ「上位クラス (P279)」のバリューとして「指揮者 (Q158852)」を有していた。
- ウィキデータ・クエリ・ビルダーが作成したクエリは、指揮者の下位クラスも表示するものだった(上掲)
調査2
そこで、クエリを修正して再度変更することに。具体的には、下記のとおり「指揮者の下位クラスは表示しない」よう修正し、実行しました。つまり、クエリが単純化したということですね。なお、単にプロパティ「専門分野 (P101)」のバリューとして「クラシック音楽 (Q9730)」をもつという条件を加えればよいか?とも思いましたが、これを満たすデータは「クラシック音楽の指揮者」にもあまりないのではと思ったので不採用としました(本来ならこちらのクエリでも比較・検討するべきですが、今回はお遊びなのでご容赦ください)。
分析
データ一覧
調査結果の分析にあたり、まずは下記のとおり統計を示しておきます。なお、表の右端にある減少率は、差分を調査1の値で割ったものに100をかけた値です。つまり、値が大きいほど、調査2が影響を与えた(調査1でより多くノイズが含まれていた)ということですね。
当初の疑問の答え
当初の疑問「オーボエの演奏経験がある指揮者と、チェロの演奏経験がある指揮者って、どっちが多いんだろう」については「チェロの経験がある指揮者の方が多い」という答えになりました。これは調査1、2の双方で共通しています。
違和感は当たっていたし外れていた
調査1の結果を見て「トランペット経験者は本当にここまで多いのかな?いわゆる『指揮者』ではない、クラシック音楽以外のミュージシャンが含まれているのでは?」という違和感を抱き、調査2を実行したわけですが、この違和感については「当たっていた部分も、間違っていた部分もある」と言うべきかなと思います。
まずは当たっていた部分について、トランペット経験者のデータは調査1から調査2でかなり減少しました。具体的には552件から449件、すなわち103件減少しました。減少率についても、他の楽器と比べて比較的高い方です。これは、調査1でいわゆる「指揮者」とはいえないミュージシャンが多く含まれていたことを示しています。
ただし、条件を変更して検索しても「トランペットを経験した指揮者はそこそこいる」という結果は変わりませんでした。具体的には、調査1、2の双方で第3位という立ち位置でした。これはひとえに私の勉強不足ですね。なお、きちんと分析するのであれば、調査2で提示されたデータの整備状況(いわゆる「クラシック音楽の指揮者」ではないミュージシャンがどの程度含まれているか)についても精査する必要がありますが、今回はお遊びなのでご容赦ください。
また、興味深いことに、減少率が高い打楽器、フルート、チューバ、コントラバス、トランペット、トロンボーン、ピアノについては「クラシック音楽以外でもよく使われる楽器」でした。ただし、この現象の意味づけについても、分母や実際のデータ内容を確認しないと迂闊なことは言えないので、ここでは深入りしないこととします。
やっぱりピアノとヴァイオリンの経験者は多い
また、調査1、2の双方で、ピアノとヴァイオリンがツートップでした。これはクラシック音楽オタクとしての私の直感とも合致します。
まとめ
本稿では、ウィキデータ・クエリ・サービスを活用して指揮者たちの楽器経験をまとめたプロセスを記しました。また、オタク知識(「ドメイン知識」と言えるほどのものではありません)を活用して、クエリを修正した経緯やその妥当性についても記しました。本稿がどなたかのお役に立てば幸いです。
感想
読んでいただいた方はお分かりかと思いますが、私はデータサイエンスのど素人です。指摘・修正などお待ちしています。また、私自身でもデータサイエンスの勉強をきちんと行おうと思います。
Can you help us translate this article?
In order for this article to reach as many people as possible we would like your help. Can you translate this article to get the message out?
Start translation