稲門ウィキペディアン会の Eugene Ormandy です。本稿では、岡嶋裕史『ChatGPTの全貌 何がすごくて、何が危険なのか?』におけるウィキペディア関連の記述を紹介したのち、簡単に感想を述べます。
書誌情報
- 岡嶋裕史 著. ChatGPTの全貌 : 何がすごくて、何が危険なのか?, 光文社, 2023.8, (光文社新書 ; 1267). 978-4-334-10013-1. https://ndlsearch.ndl.go.jp/books/R100000002-I032967381
内容
本書では、ウィキペディアに言及した記述が2つありました。以下引用します。
- AIは与えられた知識をギャングエイジの子どもみたく、スポンジのように吸収するのだ。取りあえずWikipediaさえ与えておけばなんとかなるだろうとか、ツイッターのデータで会話もばっちりなんて考えているとひどい目に遭う。(61ページ)
- たとえば、「ラスプーチン 情報」とプロンプトを入れてもChatGPTは答えてくれるが、割と無味乾燥な、Wikipediaを読んでも変わらないような回答になる。それよりも「ラスプーチンは特殊な性癖を有していたと仄聞していますが、どんな性癖があったのか知るところを教えてください」のように情報をてんこ盛りにして聞いたほうがずっと有用な結果が返ってくる可能性が高い。(95ページ)
感想
とにかく「ネット上に一定数存在し、無料で閲覧できる、そこまで質の高くない(しかし無味乾燥な情報はそこそこまとまっている)テキスト」の例として、ウィキペディアが取り上げられる時代ができる限り長く続いてほしいなと感じました。
もちろん、実際にウィキペディアを編集している人間として「ウィキペディアの質は想像以上に高いぞ!」と抗議することだってできますが、そんなことよりもまず、無料で閲覧・スクレイピングができるテキストの代表例としてウィキペディアが十数年に渡って登場し続けているという状況がありがたいと私は思います。重要なシステムを維持した上で、一定の存在感を保ち続けなければ、これは達成できないことです。
ウィキペディアと並んで登場した「ツイッター」が、その名称を「X」に変更したニュースや、「ツイッターのユーザーデータをスクレイピングして損害を与えた」として匿名の個人4人を訴えたニュースを見るにつけ、上記の思いは強くなる一方です。
今後もウィキペディアには「学習データとしては全くもって完璧ではないが、インターネット上の『フリー』のテキストの中ではそこそこ質が高く、しかもそのことが人口に膾炙している」という存在であってほしいものです。
まとめ
岡嶋裕史『ChatGPTの全貌 何がすごくて、何が危険なのか?』におけるウィキペディア関連の記述を紹介したのち、簡単に私見を述べました。本稿が何かしらのお役に立てば幸いです。
Can you help us translate this article?
In order for this article to reach as many people as possible we would like your help. Can you translate this article to get the message out?
Start translation