稲門ウィキペディアン会の Eugene Ormandy です。2024年7月、ウィキデータ・クエリ・サービスを活用してインターネット・ミームの年表を作成したので、その模様を報告します。グラフの作成自体は簡単だったのですが、調査対象となるデータの選定に思いのほか手間取ったので、その苦労も記しておきます。なお、本稿ではウィキデータの初歩的な解説は割愛しておりますので、不明点などあれば [[Wikidata:はじめに]] などをご参照ください。
結局、何を作ったの?
ウィキデータ・クエリ・サービスを活用して、以下のインターネット・ミーム年表を作成しました。本稿では、これを作成する過程について述べます。
作成の経緯
私は2024年7月現在、ウィキデータ・クエリ・サービスを用いたデータの可視化に熱中しておりまして、ウィキメディア財団のブログ Diff に以下のような編集記を寄稿しています。
- ドロシー・ディレイの弟子がたった6人なわけないやろ!ワイが修正したる!:クラシック音楽オタクが Wikidata Graph Builder で遊びながらデータを整備した話
- 日本のヴァイオリニストの師弟関係をグラフ化するためにウィキデータを整備する
- ウィキデータ・クエリ・サービスを活用して音楽家たちの出身校を図示したうえで楽器ごとに比較する
そんなある日、YouTube を眺めていたら、”Wikidata Sparql Query Tutorial” という動画を発見。動画では、ウィキデータ・クエリ・サービスを活用して下記サムネイルのような年表が作成されていたので、自分も作ってみようと思い至りました。
ゴールの設定
上記の動画では「エジンバラ大学出身の女性」についての年表が作成されていましたが、私はこれを応用して「インターネット・ミームの年表」を作成することにしました。インターネット・ミームを選んだ深い理由は特にありませんが、もともとインターネット文化には多少興味を抱いていたので、その場の思いつきで決めました。
情報収集ののち調査対象を明確にする
ゴールを設定したので、次に行うべきは調査対象の明確化です。ただし、調査対象を明確にするためには、調査対象たりうるデータが現時点でどのように整理されているかを確認しなくてはいけません。
ということでまずは、インターネット・ミームに関する既存のウィキデータがどのように整備されているか、特に、ミームが発生した時期についてどのようなプロパティが用いられているかを調べることにしました。今回調査の足がかりとしたのは、英語版ウィキペディアのカテゴリ [[Category:Internet memes introduced in 2006]] です。ここに列挙されているウィキペディア記事およびその主題のウィキデータをいくつか確認しました。
調査の結果判明したのは、インターネット・ミームの発生時期を記述するためのプロパティとして「成立日 (P571)」と「出版日 (P577)」が混在していること、そしてそもそも発生時期に関する情報が付与されていないウィキデータもそれなりに存在するということでした。そのため、今回の調査対象とするデータの条件は、以下3つのうちいずれかとなりました。
- 「分類 (P31)」プロパティの値が「インターネット・ミーム (Q2927074)」かつ、「成立日 (P571)」プロパティに値を有するデータ
- 「分類 (P31)」プロパティの値が「インターネット・ミーム (Q2927074)」かつ、「出版日 (P577)」プロパティに値を有するデータ
- 「分類 (P31)」プロパティの値が「インターネット・ミーム (Q2927074)」かつ、「成立日 (P571)」プロパティまたは「出版日 (P577)」プロパティのいずれかに値を有するデータ
結論を先に言うと、今回の調査における調査対象の条件は1としました。2については、ノイズがより多そうだと予想し却下しました。また、3については「『成立日 (P571)』プロパティと『出版日 (P577)』プロパティの両方に値をもつデータが年表上でどのように表示されるのかわからなかったので却下しました。
なお、しっかりとした調査を行う場合は、この時点で両プロパティの制約を比較したり、明らかに不備があるデータを編集・補足したり、1から3のデータ数を確認したりする必要がありますが、今回はあくまでお遊びなので、そこまで厳密な下準備は行いませんでした。
調査手法の確定
調査対象を明確にしたので、次は調査手法を確定します。手法はいたってシンプルで、上掲の動画で紹介されていたSPARQLクエリを修正したものをウィキデータ・クエリ・サービスに入力して実行するだけです。以下、実際のクエリを記したURLと、操作画面のスクリーンショットを示します。実行は画面左の青いボタンを押すことで可能です。
ただし、上記クエリの実行結果は表形式で表示されるだけです。これを年表形式に変換するには「Table」と書かれたボタンをクリックして、表示形式を変更する必要があります。選択画面は、下記スクリーンショットのとおりです。
調査結果
上記の調査手法を実行した結果は、以下のとおりです。なお、本来は下にまだまだ結果が表示されており、スクロールすることで確認可能なのですが、全体を1枚のスクリーンショットに収めるのは不可能なので割愛しています。
一番左の値は明らかに外れ値なので、1990年代後半ごろから本稿を執筆している2024年までの部分にズームしてみましょう。皆さんがご存知のミームはあるでしょうか?
補足
明らかな外れ値として切り捨てた、1850年1月1日付の「Cristal (Q8344306)」について簡単に補足します。これは1850年に設立されたチリのビール会社およびブランドなのですが、2024年にこの会社のCMがパロディ動画素材としてSNS上で人気を博したため、同社のウィキデータ項目の「分類 (P31)」プロパティに「インターネット・ミーム (Q2927074)」という値が追加されたのです。要は、既存の事物が「インターネット・ミーム化」した場合、その時期を「成立日 (P571)」プロパティに記入することができないということですね。調査対象としてプロパティ「成立日 (P571)」に値を持つデータを選択したことに伴う限界といえるでしょう。なお、このミームについては下記の日本語記事が存在するので、興味がある方はご覧ください。
- ANTHONY WOOD「あらゆる映画の名場面にチリ産ビール「セルベッサ・クリスタル」の宣伝を挟み込むミームがSNSで大バズり 実在したチリのCMの影響で」『IGN Japan』2024年7月29日アクセス。https://jp.ign.com/star-wars-movie/73813/news/sns-cm
なお、参考までに、プロパティ「出版日 (P577)」を変数として年表を作成した場合の結果を以下に示します。こちらも似たような課題からは逃れられないことがわかります。なお、ヒットしたウィキデータの件数は、「成立日 (P571)」で調べた時が177件であるのに対し、「出版日 (P577)」は76件です。
感想
- もはや「インターネット・ミームとして成立した時期」というプロパティを新しく作るべきではと感じました。既存の語彙がインターネット・ミームとして新たな意味を持ち始めた時期を記入するためのプロパティが曖昧で、成立日プロパティと出版日プロパティのどちらかが個別の編集者の判断で使い分けられている状況(もしくはウィキデータへの記入が諦められている状況)は、あまり良いとは言えない気がします。プロパティ作成の手順・議論については明るくないので、今後勉強しようと思います。
- 正直なところ「わざわざ年表にする意味はあまりなかったかな」と思いました。というのも、とにかく見にくいからです。個別の項目のラベル(タイトル)が横長に表示されることで、その項目が時系列上のどこに位置するのか、あまりよくわからない結果になりました。今回のケースであれば、検索結果を表形式で表示したものと、年ごとのミーム数をまとめた棒グラフを併記すれば十分かなと感じました。
まとめ
ウィキデータ・クエリ・サービスを活用してインターネット・ミーム年表を作成した過程についてまとめました。本稿がウィキデータに関心がある方のお役に立てば幸いです。
Can you help us translate this article?
In order for this article to reach as many people as possible we would like your help. Can you translate this article to get the message out?
Start translation