ウィキメディア財団の新しい取り組み「Future Audiences」(将来の観衆)は昨年7月に公表、今後も知識の探求者と知識の共有者のニーズに世代を重ねて応え続けるか探し求めていきます。今回は、これまで実験して得た学びと、次にどこへ向かうか最新情報を共有します。
将来の世代はウィキペディアからどう学び、なにを貢献するでしょうか? 未来の姿はまだ不明だけれども – 昨年、ウィキメディア財団が続けた簡単な実験から、たとえオンラインの行動が変化し技術の進化が続いても、ウィキペディアは知識の探究者と共有者のニーズを数世代にわたってどのように満たすだろうか考え、より深い洞察を得ることができました。実験は初回(チャット GPT とSNSアプリの調査)を終えたばかりですので、学びをお伝えし、それをもとにしたオンラインのテキスト評価実験の計画立案にも触れたいと思います。
ちょっと復習: 「将来の観衆」とは?
世界中のすべての人に無償の知識を提供すること、それはウィキメディア運動がかかげる使命ですが、ウィキメディアのプロジェクト群の役割は、最近の技術開発のおかげで – 人工知能や新しいSNSアプリ、デジタル世界で対話する新しい方法、デバイスの進歩など、情報エコシステムが拡充して – 新しい姿を形づくる可能性が見えています。ウィキペディアが20年以上前に創設されて以来、私たちの使命は不変でも、その達成の方法はこれからも進化を続けなければなりません。
進化といえばウィキメディア財団は昨年、知識探求者や貢献者の将来の観衆にどのように取り組むか探ろうと、担当チーム横断型の協働事業として新規に調査研究のトラック「将来の観衆」を設けました(Future Audiences)。
この「将来の観衆」が期限付きの実験を始めて目指すものは、新製品の構築ではなく – 財団がどんな機会を革新するか特定しお勧めするかにあります。実験結果が有望であれば、財団はさらに多額の投資を新製品や新たな観衆を引き付けるアプローチに振り当てるかもしれません。そうでない場合でも(最初の実験については後述)チャットGPT 用のウィキペディア・プラグインの場合と同様に、リソースに大きな影響を与えることなく貴重な洞察を迅速に得ることができます。
これまでに完了した探索、そこから学んだことは?
1. 会話型 AI:単なるチャットボットじゃない
今年という年は、会話型 AI の開発に関する次のような研究課題からスタートしました。
- オンラインで知識を求める人は、ウィキペディアよりもチャットGPT から情報を得るほうに移っていくでしょうか?
- 会話型 AI にウィキペディアから情報を探してきて要約しろと命じたら、どの程度うまく、作業をこなしますか?
チャット GPT 用のウィキペディア・プラグイン構築は、2024年初の実験でした。これによりチャット GPT の利用者は、一般知識の質問の答えを探してくる情報源をウィキペディアに特化できるようになりました(ボットが教え込まれた一般的なデータではない回答を入手できる)。この実験の成果として、以下の各点を学びました。
- チャット GPT はウィキペディアに取って代わるものではありません – ウィキペディアは無償の百科事典だから。1年にわたりウィキペディアのトラフィック データおよび実験用チャット GPT プラグインの使用状況と調査データを集めたところ、消費者は情報目当てでチャット GPT のような AI チャットボットを使ったとしても、それはウィキペディアの代わりにはならず、なんらかの付加価値をもたらすのみだと結論しました。私たちのプラグインを使った利用者の報告によると、結局は直接、ウィキペディアを開いたと述べており、またその人たちはチャット GPT が拾ってきたものの情報源がウィキペディアだとわかると、チャット GPT の信頼度が上がったとも報告しています。
- 会話型 AI は(完璧ではなくても)ウィキペディアの内容を探し、要約はかなり高い精度で作成します。チャット GPT のような汎用チャットボットから情報を取得することを人々は(当然ながら)警戒しているようですが、実験用プラグイン作成のために用いた過程では、決して完璧ではなくても、かなり高品質の出力を提供しました(その過程とは、検索拡張生成もしくはRAGと呼ばれる手法のことで、人工知能を使ってウィキペディアその他の特定の知識ベースから関連情報をもっと賢く検索し、概要を利用者に返すこと)。
ここから私たちが導き出した結論では、生成 AI は一方で将来の観衆にとって、ウィキペディアの知識をより効率的に得るための重要な役割を果たすかもしれないし、他方、その同じ働きを果たすには、チャットボットが唯一または最良の方法とは限らないということです。これらの発見から、次の AI 実験として「要出典」拡張機能にもつながりました。(Citation Needed=詳細は後述。)
2. パーソナリティの人気で引っ張るSNS:新しいコアな細道?
チャット GPT 元年とも言える2023年でしたが、昨年の外部の傾向年次報告で私たちは別の重要な傾向も特定していました。若い観衆は情報を求めるときウェブ検索やウィキペディアではなく、TikTok や YouTube などパーソナリティ主導のSNSアプリを使う傾向が高まっている点です。この洞察から次のような疑問が生まれ研究対象になりました。
- ウィキペディアのコンテンツをもっとSNSアプリに適した形式にリミックスすると、情報は若い観衆にとって魅力が増すでしょうか?
- これらのアプリのコンテンツ作成者には、ウィキメディアのプロジェクト群にある信頼できる情報やコンテンツを共有したいという人はいるでしょうか?
定性調査を通じて、次のこと、つまりSNSアプリの消費者と作成者に対するアンケート、インタビュー、使いやすさ調査について理解できました。
- 若い観衆はオンラインで見る情報に対して懐疑的であり、学ぶ相手は個性のないウェブサイトではなく、人々を好みます。この層の注意を引くには、その情報を提示する形式が明らかに重要で(つまり長文の文章よりも短くメディアを豊富に載せた体験を好む傾向があり、誰がコンテンツを発信したかも非常に重要です。)これはウィキペディアが信頼できる知識に関心を寄せる人々のコミュニティであり、左記の聴衆にそのことをさらに明確に示す機会となるかもしれません。TikTok などのアプリには知識のクリエイターと呼ばれる人々のコミュニティがあり、ウィキメディアのプロジェクト群から事実や画像を共有し、多くの観衆に波及させています。これらクリエイターは自分が情熱を注いだトピックに関して信頼できる知識の共有に突き動かされており、コンテンツ作成の情報源としてウィキペディアに依拠しています。この人たちは直接、私たちのプロジェクトに貢献することに興味はないものの、私たちには、この人たちの参加を得る方法、革新的な新しい方法で無償の知識を広め、世界の若者を私たちの運動により多く招待する方法を模索する機会を選べます。
次はどこへ行ってみる?
次の試み:「要出典」拡張機能
デジタル空間が誤情報に圧倒されるリスクが高まっているため、私たちは AI を用いてウィキペディアの知識を活用、読者がオンラインで消費する情報の信頼性を知るようにできないか模索しています。
「要出典」(Citation Needed)とは、上記の機能に特化した試験用の拡張機能の名前です。対象はインターネット用ブラウザの Chrome 限定で、独自に採用する大規模言語モデル(LLM=Large Language Model)があることから、利用者はオンラインで閲覧中のウェブサイトの内容と、ウィキペディアの掲載内容をすばやく比較できます。この拡張機能は、選択した主張をウィキペディアの情報が裏付けできるかどうか、関連のある記事の情報を利用者に表示します。(ウィキペディアに載っている記事が含む出典の数、記事に携わった寄稿者数、最後に編集された日付など。)初回の生成 AI 実験と同様に、この機能では AI がウィキペディアから情報を検索して要約する能力をどの程度うまく発揮するか、注意深く追跡していきます。今後数ヵ月間は、要出典拡張機能は実験に興味を寄せた利用者に提供され、その人たちから使用状況とフィードバックを得て評価する予定です。
この出典に関する「Citation Needed」拡張機能についてさらに詳しく読んだり、試験に協力したい場合は、メタウィキのプロジェクト・ページを開き、ご確認ください。