Comment trouver ce que vous cherchez sur Wikipédia ?
Si le lectorat sait exactement quel article ils veulent lire (disons, Chat), plusieurs peuvent aller sur Wikipédia et le taper dans la barre de recherche.
Mais s’ils ont une question, par exemple, « Les chats voient-ils dans le noir ? », ils sont hautement susceptibles de se rendre sur un moteur de recherche externe et d’y poser leur question. Ils peuvent ensuite cliquer sur les résultats pour accéder à l’article Wikipédia correspondant, ou simplement lire l’aperçu de l’article proposé par le moteur de recherche sans se rendre sur le site. Aujourd’hui, on estime que 78 % des sessions de lecture sur Wikipédia commencent sur des moteurs de recherche externes, dont environ 90 % proviennent de Google Search.
La valeur de Wikipédia réside dans son contenu fiable, créé par des humains et pour des humains. Si nous voulons que le monde utilise et apprécie ce contenu, il faut que les gens puissent le trouver directement, sans qu’il soit remixé et régurgité par l’IA sur les plateformes des géants du web. Quand le lectorat trouve systématiquement plus simple d’accéder au contenu de Wikipédia via d’autres sites, Wikipédia risque de devenir une simple source de données en arrière-plan, plutôt qu’une destination vivante pour apprendre, s’émerveiller et prendre du plaisir.
Dans cet article, nous expliquons pourquoi la fonction de recherche sur Wikipédia ne suffit plus pour beaucoup de lecteurs et lectrices aujourd’hui, ce que nos recherches révèlent sur la façon dont les gens cherchent réellement, et comment nous travaillons sur la recherche sémantique en partenariat avec les contributeurs.
Le problème : le lectorat ne trouvent souvent pas ce qu’ils cherchent sur Wikipédia.

Comme le montre l’exemple ci-dessus, la recherche sur Wikipédia n’est pas très efficace quand quelqu’un pose une question ou veut explorer un sujet qui ne correspond pas parfaitement à un seul article. Face à cette friction, le lectorat se tournent souvent vers les grands moteurs de recherche. Le type de recherche qu’ils proposent – souvent appelé recherche sémantique – va bien au-delà de la simple correspondance de mots : grâce à l’apprentissage automatique, il parvient à comprendre l’intention réelle de l’utilisateur ou utilisatrice.
Explorer la recherche sémantique sur Wikipédia
Pour pallier cette lacune, une équipe interdisciplinaire de la Fondation Wikimédia, le groupe de travail sur la recherche d’informations, s’efforce d’améliorer la fonction de recherche sur la plateforme afin que le lectorat puisse trouver directement ce qu’ils cherchent sur Wikipédia.
Nous explorons notamment les questions suivantes :
- À quelle fréquence le lectorat arrive-t-il avec des questions ou des requêtes exploratoires plutôt qu’avec un article spécifique en tête ?
- Dans quelles situations la recherche par mot-clé rend-elle difficile pour le lectorat de trouver des informations pertinentes ?
- Les approches basées sur le sens pourraient-elles aider le lectorat à découvrir plus efficacement les articles et les sections existants de Wikipédia ?
- Quels risques, limites ou compromis doivent être soigneusement pris en compte avant d’aller plus loin dans cette voie ?
Bien que certains moteurs de recherche superposent désormais des résumés générés par l’IA aux résultats de recherche, il s’agit d’une fonctionnalité distincte de celle que nous explorons ici. Ce travail se concentre sur l’exploitation de la recherche sémantique afin de mieux mettre en avant les articles et sections existants de Wikipédia créés par des éditeurs et éditrices, et non pas pour générer de nouvelles réponses ou de nouveaux résumés.
Résultats de recherche
Le groupe de travail a récemment achevé un rapport de recherche s’appuyant sur des études de conception, des prototypes techniques et les commentaires de la communauté afin de vérifier si ce problème était réel et si l’amélioration de la recherche aiderait réellement le lectorat. Nos conclusions ont confirmé ces deux points. Voici un résumé de ce que nous avons appris :
1. Environ 98 % des sessions de lecture sur Wikipédia proviennent de sources autres que la recherche Wikipédia.
- Le petit groupe qui utilise la recherche interne est largement plus susceptible d’être composé d’éditeurs que de lecteurs occasionnels. La majorité lectorat passe d’un article à l’autre en retournant vers des moteurs de recherche externes, même lorsqu’il existe des liens au sein même de Wikipédia.
2. Environ 80 à 95 % des sessions de recherche sur le wiki utilisent les suggestions de saisie semi-automatique.
- La préférence pour les suggestions d’autocomplétion (celles qui apparaissent lorsque l’utilisateur ou utilisatrice tape) montre que de petites améliorations en termes de vitesse peuvent avoir un impact considérable.
3. Entre 4 et 7 % des requêtes de recherche sur Wikipédia sont formulées sous forme de questions, mais ces requêtes ont moins de chances d’aboutir.
- Bien qu’il s’agisse d’une minorité de recherches, cela montre que certains lecteurs et certaines lectrices tentent cette approche et que beaucoup d’autres l’évitent probablement parce qu’ils ont compris qu’elle ne fonctionne pas.
Prochaines étapes : expérimentation et discussion communautaire
Sur la base de ces recherches, nous pensons qu’une approche hybride combinant la recherche sémantique et la recherche par mot-clé est la plus susceptible d’aider le lectorat à trouver plus facilement les informations qu’ils recherchent. Lors des premiers tests, la combinaison des deux méthodes a donné les résultats les plus pertinents et a suscité la plus grande satisfaction chez le lectorat.
Notre prochaine étape consiste en une expérience à petite échelle visant à tester une expérience de recherche hybride sur Wikipédia. Les résultats de cette expérience, ainsi que les commentaires des éditeurs et éditrices, permettront de déterminer si et comment la recherche sémantique devrait être intégrée aux outils de recherche de Wikipédia.
Nous documenterons les progrès réalisés sur Méta-Wiki et MédiaWiki et partagerons les mises à jour via des discussions communautaires (bistrot), des newsletters, des appels communautaires et des événements. Les commentaires des éditeurs et éditrices, en particulier sur les risques et les compromis, détermineront directement si et comment la recherche sémantique sera développée, testée ou suspendue.
La valeur de Wikipédia repose sur un savoir créé par des humains et digne de confiance. En améliorant la recherche, on peut aider davantage de personnes à trouver ce savoir, à explorer ce qui les passionne et à revenir régulièrement.
Pouvez-vous nous aider à traduire cet article ?
Pour que cet article soit diffusé au plus grand nombre, nous avons besoin de votre aide. Pouvez-vous traduire cet article pour faire passer le message ?
Commencer la traduction