Wie findest du etwas in Wikipedia?
Wenn Lesende den genauen Artikel kennen, den sie lesen möchten (zum Beispiel den Artikel Hauskatze), können sie ihn direkt als Stichwort über die Suchleiste in Wikipedia suchen.
Aber wenn sie eine Frage haben – etwa Können Katzen im Dunkeln sehen? –, ist es deutlich wahrscheinlicher, dass sie eine externe Suchmaschine verwenden, um die Antwort zu suchen. Dann klicken sie vielleicht auf den Wikipedia-Artikel in den Suchergebnissen oder lesen einfach die Textvorschau eines Artikels in den Suchergebnissen, ohne überhaupt Wikipedia zu besuchen. Stand heute beginnen schätzungsweise 78 % der Wikipedia-Lesesessions in externen Suchmaschinen, etwa 90 % davon in der Google-Suche.
Der Wert der Wikipedia liegt darin, vertrauenswürdige Inhalte zu liefern, die von und für Menschen erstellt werden. Wenn wir wollen, dass die Welt diese Inhalte nutzt und zu schätzen weiß, müssen sie auffindbar sein, ohne erst von einer KI auf einer großen Technologieplattform aufbereitet worden zu sein. Wenn Lesende es immer einfacher finden, Wikipedia-Inhalte über andere Websites zu erreichen, besteht das Risiko, dass Wikipedia eine Datenquelle im Hintergrund wird, statt ein Ziel für Wissbegierde und Freude am Lernen zu sein.
In diesem Beitrag erklären wir, warum die Suche auf Wikipedia heute für viele Lesende nicht nutzbar ist, was unsere Untersuchungen dazu, wie Menschen tatsächlich suchen, ergeben haben, und wie wir semantische Suche in Zusammenarbeit mit Beitragenden erforschen.
Das Problem: Lesende finden in der Wikipedia oft nicht, was sie suchen

Wie das obenstehende Beispiel zeigt, ist die Wikipedia-Suche nicht sehr effektiv, wenn jemand eine Frage hat oder ein Thema erforschen möchte, das nicht mit genau einem Artikel verknüpft ist. Wenn Lesende dieses Problem bemerken, weichen sie oft auf die großen Suchmaschinen aus. Die Art der Suche, die diese anbieten – oft als semantische Suche bezeichnet – geht über den reinen Wortvergleich hinaus, indem sie maschinelles Lernen nutzt, um die Absicht der Nutzenden zu verstehen.
Semantische Suche in Wikipedia
Um diese Lücke zu schließen, arbeitet ein interdisziplinäres Team der Wikimedia Foundation – die Arbeitsgruppe Information Retrieval – daran, die Suche auf der Plattform zu verbessern, damit Lesende direkt in Wikipedia finden können, wonach sie suchen.
Insbesondere beschäftigen wir uns mit Fragen wie:
- Wie oft kommen Lesende zu uns, die Fragen oder forschende Suchanfragen haben, statt einen bestimmten Artikel im Sinn zu haben?
- In welchen Situationen kann die Stichwortsuche Lesenden das Finden relevanter Informationen erschweren?
- Könnten bedeutungsbasierte Ansätze Lesenden helfen, bestehende Wikipedia-Artikel und Abschnitte effektiver zu durchsuchen?
- Welche Risiken, Einschränkungen oder Kompromisse sollten bedacht werden, bevor diese Initiative weiterverfolgt wird?
Einige Suchmaschinen zeigen jetzt KI-generierte Zusammenfassungen oberhalb der Suchergebnisse an, aber das ist eine andere Funktion als das, was wir hier untersuchen. Unsere Arbeit konzentriert sich auf die Nutzung semantischer Suche, um bestehende, von Beitragenden erstellte Wikipedia-Artikel und Abschnitte zugänglicher zu machen, und nicht darauf, neue Antworten oder Zusammenfassungen zu erzeugen.
Ergebnisse der Untersuchungen
Die Arbeitsgruppe hat kürzlich einen Bericht erstellt, der sich auf Designuntersuchungen, technische Prototypen und Community-Feedback stützt, um zu prüfen, ob dieses Problem wirklich besteht und ob die Verbesserung der Suche Lesenden sinnvoll helfen könnte. Unsere Ergebnisse bestätigten beides. Hier ist eine Zusammenfassung unserer Erkenntnisse:
1. Etwa 98 % der Wikipedia-Lesesessions beginnen außerhalb der Wikipedia-Suche.
- Die kleine Gruppe, die die interne Suche nutzt, besteht eher aus Beitragenden denn aus Lesenden. Die meisten Lesenden navigieren zwischen Artikeln, indem sie zu den externen Suchmaschinen zurückkehren, auch wenn Links innerhalb von Wikipedia vorhanden sind.
2. Etwa 80–95 % der Onwiki-Suchvorgänge nutzen Vorschläge aus der Autovervollständigung.
- Die bevorzugte Nutzung von Vorschlägen aus der Autovervollständigung – die angezeigt werden, sobald jemand etwas ins Suchfeld eintippt – zeigt, dass kleine Verbesserungen der Suchgeschwindigkeit große Wirkung haben können.
3. Etwa 4–7 % der Wikipedia-Suchanfragen werden als Fragen formuliert, aber solche Anfragen sind wahrscheinlicher nicht erfolgreich.
- Auch wenn es sich hier um einen kleinen Anteil der Suchanfragen handelt, zeigt dies, dass manche Lesende es zumindest versuchen und andere es vermutlich vermeiden, da sie bereits wissen, dass es nicht funktioniert.
Nächste Schritte: Experimente und Community-Diskussion
Auf der Grundlage dieser Untersuchungen glauben wir, dass ein hybrider Suchansatz, der semantische Suche und Stichwortsuche kombiniert, das größte Potenzial hat, Lesenden zu helfen, Informationen leichter zu finden. Bei den ersten Tests ergab die Kombination der beiden die relevantesten Ergebnisse und die höchste Zufriedenheit bei Lesenden.
Unser nächster Schritt ist ein kleines Experiment, das eine hybride Sucherfahrung in Wikipedia testet. Die Ergebnisse dieses Experiments und die Rückmeldungen von Beitragenden werden dazu beitragen, festzustellen, ob und wie die semantische Suche Teil der Suchwerkzeuge von Wikipedia werden kann.
Wir werden die Fortschritte im Meta-Wiki und im MediaWiki-Wiki dokumentieren und Updates in Projektdiskussionen, in Newslettern, bei Communitygespräche und bei Veranstaltungen bekanntgeben. Die Rückmeldungen der Beitragenden, insbesondere zu Risiken und Kompromissen, werden direkt beeinflussen, ob und auf welche Weise die semantische Suche entwickelt, getestet oder pausiert wird.
Der Wert der Wikipedia beruht auf von Menschen geschaffenem, vertrauenswürdigem Wissen. Durch die Verbesserung der Suche können wir mehr Menschen helfen, dieses Wissen zu finden, ihre Interessensgebiete zu erkunden und regelmäßig zurückzukehren.
Can you help us translate this article?
In order for this article to reach as many people as possible we would like your help. Can you translate this article to get the message out?
Start translation