ウィキペディア利用者に新しいトレンド

Translate this post
Isiwal、CC BY-SA 4.0 https://creativecommons.org/licenses/by-sa/4.0、Wikimedia Commons より

3月のこと、ウィキメディア財団は私たちの運動に波及するグローバルなトレンドをシェアしました。それらのトレンドはウィキメディアのプロジェクト群に形を与えるばかりか、世界中の広範なインターネットを形造ります。営利企業がどれほどウィキペディアのコンテンツを頻繁に用いて新しいAI体験の裏付けをしているかも、左のトレンドに含まれました。4月には、ボットやクローラがウィキペディアのコンテンツを漁りに来て、私たちのインフラにどれほど重い負荷をかけるか述べました。

ウィキメディアのプロジェクト群では、ボットとクローラが相変わらずトラフィックデータに捨て置けない影響を及ぼしています。今回、ディフに投稿するにあたり、最近、ウィキペディアの利用者トラフィック・データをどのように更新したかご説明し、データから読み取れるトレンド、財団としてどう対応するか、また皆さんにご助力いただけることを記したいと思います。

人間のページ閲覧をもっと鮮明に示したい

毎月、ウィキペディアのほかウィキメディアのプロジェクト群が世界中から受けるページビューは数十億回に達します。ウィキメディア財団のアルゴリズムはこうしたトラフィックの行為者が人間かボットか分類してきました。そうしておけば人間によるトラフィックの規模を正確に把握でき、またサードパーティのボットが商用検索やAI体験を強化しようとデータをどのように取得するのか、その方法に制限を設定できます。ウィキペディアなどのウェブサイトからデータを漁る(スクレイピングする)多くのボットは高度化が進み、人間のふりを装おうとします。トラフィックの分類方法を継続的に更新し、今後も指標精度をできるだけ維持していきます。

2025年5月頃からの観測によると、明らかに人間が操作すると示したトラフィックがブラジルを起点に異常に増え続けていました。それを契機にボット検出システムを調査・更新。この新ロジックを用いて2025年3月 – 8月度のトラフィックデータを再び分類したところ、5月と6月のトラフィック異常増加の大部分は、実は検出回避を組み込んだボットによると判明しました。

このように私たちがデータを修正する意味とは、一方では時期によってボット検出システムが適用するルールが異なるため、データの慎重な解釈が求められるからです。その他方、前述の修正後にウィキペディアにおける人間のページビューを観察したところ過去数ヵ月にわたって減少を続け、その率は2024年同時期比でおよそ約8%減に達しています。この減少は生成AIとソーシャルメディアが人々の情報検索方法に与える影響を反映していると考えており、特に検索エンジンがウィキペディアのコンテンツに基づく回答を直接、検索者に提供する事例が増えました。

【図】ウィキペディアのページ閲覧回数

(図:2021年9月以降、ウィキペディアの全言語版に対する
人間のページ閲覧を分析。ページ閲覧回数は2025年4月以降改訂
黄色の線はボット検出改善後のデータ
[凡例縦軸:利用者による次のページ閲覧回数。横軸:年。

変わっていくインターネット

こうした減少は想定内です。検索エンジンは生成AIを活用して私たちのようなサイトから回答をとってきて、引用元のリンクを示さないまま、直接、それを検索者に提供する、そういう傾向がますます強まっています。また若い世代には、情報を探すときにオープンなウェブ空間ではなく、ソーシャル動画プラットフォームを開く傾向が見られます。こうした緩やかな変化はなにもウィキペディアに限りません。情報を探す利用者がついやす時間は、検索エンジンやAIチャットボット、ソーシャルメディアなどの営利企業のサイトで増えている件は、多くの出版社やコンテンツ・プラットフォームからも同様の変化が報告されています。そればかりか、そういった営利企業によってそれぞれのインフラにかかってくる負担をも実感せずにいられないとのことです。

この状態は、情報はウィキペディアから得るけれども、直接のアクセスはしない利用者が一部いるという意味ですが、それはそれとして、こうした新しい形式の知識発信にとっては、ウィキペディアもデータの依拠データセットとして、最も貴重な部類に入る点は変わっていません。大規模言語モデル(LLM)のほぼすべてが、ウィキペディアのデータセットを使ったデータトレーニングを実施しており、検索エンジンやソーシャルメディア・プラットフォームでは利用者の質問に答えるとき、ウィキペディアの情報を優先して利用しています。それがなにを意味するかと言えば、情報利用者本人はインターネットで「wikipedia.org」というサイトにアクセスしていなかろうとも — インターネット全域で読まれている知識は、ウィキメディアのボランティアの皆さんほかが作成されたものなのです。そのような人間が作成した知識は、信頼できる情報をオンラインで広めていこうとするとき、これまで以上に重要になります。そして実際にウィキメディア財団が実施する定期大規模調査によると、ウィキペディアは中立で正確な情報源として世界から高い信頼と評価を得てその状態をキープしています。

人々が知識を得る新しい方法を私たちは歓迎します。しかしながらLLMやAIチャットボット、検索エンジンやソーシャルプラットフォームには、もっと多くの人にウィキペディアを訪問するように勧めてもらわなければならないし、それはウィキメディアのコンテンツ利用と、多くの人々やプラットフォームが依存する無償の知識の流通と、どちらも持続させるために必須なのです。ウィキペディアへのアクセスが減った場合、コンテンツの充実を保つボランティアの数も減るだろうし、この活動を支援する個人寄付者も減ってしまう恐れがあります。インターネット上の情報を支える唯一の大規模サイトとして、ウィキペディアは検証可能性と中立性と透明性の基準を備えているおかげで人々の日常の情報ニーズに応じており、これまで、目には見えなくても不可欠な存在であり続けました。世間の人々がインターネット上で情報をシェアされてそれを信頼できるかどうかは、それぞれのプラットフォームが情報の出所を明確に示し、それら情報源へのアクセスや参加の機会を高まることが肝心なのです。

この瞬間に対応するには

グローバルなトレンドを定期的に評価している当財団としては、インターネットで予測される変化の対策に踏み出しました。私たちを取り巻く世界が変化を重ねるという現時点も使命を果たそうとする私たちには、次の重要な取り組み(イニシアティブ)も役に立ちます。

  • ウィキメディア・エンタープライズも含めて、ウィキペディアのコンテンツへの大量アクセスと再利用を実施するサードパーティには必ず責任を負ってもらいますし、私たちは方針を徹底させ、情報の出どころを示す「言及」のフレームワーク作りや、技術面の新機能の開発に取り組んでいきます。プラットフォームやエコシステムの参加者各位には建設的なご協力に感謝申しており、健全でオープンなウェブの実現を目指し、今後とも持続可能な道筋を共に築いてください。
  • 読者対応の新しい2チーム(読者の成長読者体験[])より、世間の人はウィキペディアをどう発見して閲覧するのか、新鮮な考え方とともに実験的なアプローチ方法の提言がありました(”※”=Reader Growth、Reader Experience)。
  • 直接、ボランティアの皆さんから受け取ったフィードバックに基づいて私たちの着眼点を変え、モバイル機器を使う人たちがウィキペディアを編集する方法、新規にボランティアを始めたばかりの人たちが初めての体験をもっと楽しみ生産的な編集を進めてもらうには私たちは何をすればよいか、また次世代のボランティアにとって先輩となる皆さんにはウィキペディアを作るという重荷をかついでもらうのだから、私たちにできることは何なのか。
  • 将来の観衆プロジェクトは若手の観衆のうち他のプラットフォームで時間を過ごす人たち – YouTube、TikTok、Roblox、Instagram など – に対して、動画やゲーム、チャットボットなどを経由してウィキペディアから無償の知識を提供する実験を始めます。

皆さんにも手伝っていただきたい

ウィキメディア運動において、これまで以上に求められるものは協働であり、また私たちを取り巻く環境やプロジェクトの変化に対応しながら進化をつづけることです。トラフィック傾向その他、これらのデータは利用者やコンテンツ利用方法の変化を示しており、ウィキメディアのコンテンツの持続可能性を長期に確保する対策として、できることはたくさんあります。

まず第一に、誰もがコンテンツ作成とコンテンツの完全さを求めてオンラインで自発的に支援できる方法があります。情報をオンラインで検索する際に引用元を確認し、どんどんクリックして元の情報源へ行って閲覧しましょう。身近な人たちと意見を交換して、人間による査読が済んでいて信頼に足りる知識がなぜ、どのように重要なのか、また生成AIが基盤として採用したコンテンツの作り手は生身の人間だと考えたり、さらにその人たちはきっと皆さんのご支援に感謝するだろうこともお伝えください。

実際に活動しておられるボランティアの皆さんには、この重要な局面への対応をさらに進めるためウィキメディア財団の各チームと協働していただけませんか。ウィキペディアの新しい体験やツールのテスト参加をお勧めします。インターネットが急速に変化する今こそ、私たちの約束である人間中心の無償の知識を守り世界に提供していきながら、ウィキペディアを変えるべき部分はどこか(さらに変えてはならないのはどの部分か)考える時ではないでしょうか。

ボランティアの皆さんにこそご尽力いただける、特定の領域がありますので、私たちが新しく立ち上げた読者チームの話をします。読者にとって最も役に立つのは何か、それは私たちがかかえる未解決点なのですが、その鍵となる現行の実験を、ぜひ皆さんに評価していただきたいのです。読者チームのトークページを開いて協議に参加したり、同チームのニュースレター購読によって、皆さんのご意見をシェアしたり同チームの実務についていろいろ見聞きしていただけませんか。そしてまもなく、コミュニティの皆さんにもお声がけする予定ですので、ここで述べたトレンドをめぐって、それらがウィキメディアのプロジェクト群にどんな意味を持つのか、対面でもオンウィキでも皆さんと話を交わせるよう望んでいます。

創設から25年、ウィキペディアの人智の価値はこれまでにないほど高まっています。私たちの理想は、今後とも誰もが知識の創造と共有に参加できること – その実現には無償の知識のエコシステムを訪れる全員が、責任のある使い方をすること。皆さんのお力を幅広くお借りできたなら、方法の新旧にしばられずに私たちの知識のプラットフォームを支えることが可能だし、ウィキペディアは今後とも存在し続けるし、そうすれば将来の世代にもインターネット上に的確な人智を無償で提供できる、そう楽観したいものだとつくづく考えております。

Can you help us translate this article?

In order for this article to reach as many people as possible we would like your help. Can you translate this article to get the message out?