ChatGPT 5を使って、あるエンティティの各言語版ウィキペディアにおけるバイト数を表示するアプリケーションを開発してみた

Translate this post

稲門ウィキペディアン会の Eugene Ormadny です。2025年8月13日、公開されたばかりのChatGPT 5を用いて、あるエンティティの各言語版ウィキペディアにおけるバイト数を表示するアプリケーションを開発したので、その模様をまとめます。

稲門ウィキペディアン会のロゴ (Uraniwa, CC0)

GPT-5の登場

2025年8月7日、OpenAIGPT-5を公開しました。コーディング能力が向上し、自然言語で指示をするだけでアプリを簡単に作成できるようになったとのことだったので、自分で試してみることにしました。いわゆるバイブコーディングというやつです。

作成するアプリを考える

どのようなアプリを作成するか考えた結果、ウィキデータに関連するものを作ることにしました。具体的には、かねがね「ウィキペディアに組み込まれているといいな」と思っていた「あるエンティティのウィキペディア記事が、各言語版でどの程度のバイト数かを表示する機能」を備えたアプリを作ることにしました。

下記スクリーンショットのとおり、あるウィキペディア記事(日本語版)にアクセスすると「x個の言語版」というボタンが表示されます。それをクリックすると、同様の項目がどの言語版のウィキペディアに存在するかを確認することができますが、それぞれのバイト数については表示されません。これはあまりよくない状況だと個人的には思っていたので、それを補足するためのツールを作ることにしました。

日本語版ウィキペディア[[OpenAI]]のスクリーンショット。2025年8月17日 (日) 03:19 (UTC)版。韓国語版や英語版のウィキペディアにもOpenAIのページがあることが分かるが、それぞれ何バイトかはわからない。(Japanese Wikipedia, CC BY-SA 4.0)

自然言語でアルゴリズムを作成

作成するアプリの概要が決まったのち、そのアルゴリズムを自然言語でまとめました。具体的には「入力した文字列を日本語版ウィキペディアで検索し、ヒットしたらそのウィキデータを取得。そのウィキデータにリンクされている全ての言語版のウィキペディアのバイト数を取得して降順でソート」という流れで書きました。もちろん「ヒットしなかった場合は『ウィキデータでキーワードAに対応するデータDを検索』と表示する」などの分岐も明記しています。

アプリ作成

上記の自然言語アルゴリズムをまとめたファイルをChatGPT 5にアップロードして、「添付のファイルを満たすアプリをChatGPT上で作成して」と指示。すると、下記画像のとおりアプリが作成されました。その後「渋谷」「スティーブ・ジョブス」などのキーワードで実験を行い、指示が満たされていることを確認しました。

作成したアプリの様子 (Eugene Ormandy, CC0)

課題

アプリは概ねうまく機能しましたが、曖昧さ回避をめぐる検索には課題がありました。

自然言語で作成したアルゴリズムには「キーワード検索でヒットしたウィキペディア記事が曖昧さ回避ページである場合には、同名の記事をリストアップした上で、ユーザーに正しいエンティティを選択させて」と指示していたのですが(詳細は下記)、「リンゴ」というキーワードを入力したところ「リンゴ (曖昧さ回避)」というページに列挙されているページではなく、果物の「リンゴ」についてのバイト数をいきなり表示したのです。

これは、日本語版ウィキペディアにおける曖昧さ回避をめぐる検索システムに起因する問題といえるでしょう。今後、似たようなアプリを作る際は、細かく調整したいですね。

  • (自然言語アルゴリズム抜粋)日本語版ウィキペディアの記事Bが曖昧さ回避ページの場合(URLの末尾に (曖昧さ回避) という文字列がある場合)、記事Bの本文内で紹介されている全てのウィキペディア記事のタイトル、URLを表形式で表示し、「知りたいウィキペディアは記事はどれですか」という質問と、記事ごとのチェックボックスを表示する

まとめ

ウィキデータを活用したアプリを、バイブコーディングで作成した模様についてまとめました。どなたかの参考になれば幸いです。

Can you help us translate this article?

In order for this article to reach as many people as possible we would like your help. Can you translate this article to get the message out?