セマンティック・ウェブ、ウィキデータ、LLM

Translate this post

私はGraphRAGに興味があり、特に「自然言語のプロンプトのみに基づきウェブ上の知識グラフ(特にウィキデータ)から適切な推論を行うことが可能か」に関心があります。

もちろん今後のLLMの動向なんて読めるはずもないのですが、より重要さを増してくる要素として、使用する電力および計算資源の削減は間違いなく挙げられるわけで、それを実現するための指針の一つとして「ウィキメディア・プロジェクトをはじめとするウェブ上の有用な知識ハブを効果的に探索すること」はかなり重要と個人的には思っています。

現行の各種モデルの思考過程(として各社が表示するもの)を見たところ、まずウィキペディアを参照するというプロセスはどれも共通しているように思われるわけですが、先日書いたブログ記事「LLMにプロンプトを与えるだけでウィキデータベースのGraphRAG風の処理ができるか実験してみた」で紹介したようなウィキデータQIDへのエンティティ・リンギングをはじめとする、ウィキメディア・プロジェクトをめぐる細かいタスクの精度はイマイチだなと思われるので、今後の改善を期待する所存です。

「我々ウィキデータ編集者をはじめとする多くの人々が、夢を見ながら整備したセマンティック・ウェブを上手く使ってくれよLLMさん!」と私は思っているわけですが、それと同時に「恐ろしく発展した計算機ですら上手く使いこなせないようなセマンティック・ウェブって、いったい何だったのかしら?」という思いもなくはないのが正直なところです。

雑多な倉庫とコンピュータ (Someone Not Awful, CC BY-SA 4.0)

Can you help us translate this article?

In order for this article to reach as many people as possible we would like your help. Can you translate this article to get the message out?