Búsqueda semántica: una forma más sencilla de encontrar información

Translate this post

¿Cómo encontrar lo que buscamos en Wikipedia?

Cuando saben el título exacto del artículo que desean leer (por ejemplo, Gato), algunas personas lo escribirán directamente en la barra de búsqueda.

Sin embargo, cuando tienen una pregunta (por ejemplo: ¿Los gatos pueden ver en la oscuridad?) es más probable que acudan a motores de búsqueda externos para formularla. De allí, pueden revisar los distintos resultados hasta llegar al artículo en Wikipedia, o quizás simplemente leerán la vista previa del artículo en el motor de búsqueda, sin ingresar al sitio. En la actualidad, se estima en 78% el porcentaje de sesiones de lectura que se originan en motores externos de búsqueda, con el 90% provenientes de Google Search.

El valor de Wikipedia radica en su capacidad para proporcionar contenido confiable, hecho por y para las personas. No obstante, cuando estas pueden acceder más fácilmente a los contenidos de Wikipedia mediante otros sitios web, esta corre el riesgo de convertirse en una simple fuente de datos en el trasfondo, en lugar de ser un lugar para el aprendizaje, la curiosidad y la alegría. Por ello, si queremos que el mundo utilice y aprecie nuestro contenido, las personas deben poder encontrarlo sin que este haya pasado por la mezcla y remezcla que realizan las IA de las grandes plataformas tecnológicas.

A continuación, explicaremos el motivo por el que las búsquedas en Wikipedia no satisfacen las necesidades de las y los lectores en la actualidad, así como los datos que arroja nuestra investigación sobre el modo en que las personas realizan sus búsquedas, y el modo en que exploraremos la búsqueda semántica en conjunto con editores y editoras.

Problema: a menudo no es posible encontrar lo que buscamos en Wikipedia

Resultados de una búsqueda realizada en enero de 2026 mediante la barra de búsqueda de la página

Como demuestra el ejemplo precedente, realizar una búsqueda en Wikipedia no sirve mucho cuando le hacemos una pregunta o cuando queremos explorar un tema que no encaje perfectamente con algún artículo en específico. Al encontrar esta barrera, algunas personas acuden a los principales motores de búsqueda. En ellos, es posible realizar otro tipo de búsquedas, denominadas a menudo búsquedas semánticas, las cuales van más allá de la coincidencia de términos, mediante el empleo del aprendizaje automatizado para comprender la intención de quien ha planteado la pregunta.

Búsqueda semántica en Wikipedia

Para subsanar esta falencia, el equipo de trabajo de Recolección de Información, un equipo interdisciplinario de la Fundación Wikimedia, realiza esfuerzos para mejorar la función de búsqueda en la plataforma, de modo que sea posible encontrar exactamente lo que se busca, directamente en Wikipedia.

En particular, nos hicimos ciertas preguntas:

  • ¿Cuán a menudo recibimos preguntas de naturaleza exploratoria en lugar de búsquedas de artículos específicos?
  • ¿En qué ocasiones las búsquedas por términos clave dificultan la posibilidad de encontrar información relevante?
  • ¿Podría un abordaje enfocado en significados ayudar a descubrir artículos y secciones de artículos de Wikipedia de modo más efectivo?
  • ¿Qué riesgos, limitaciones o concesiones deberían ser cuidadosamente considerados antes de continuar con esta aproximación?

A pesar de que algunos motores de búsqueda actualmente incluyen resúmenes generados por IA por encima de los resultados de la búsqueda, ese tipo de característica es distinto de lo que pretendemos hacer. Nuestra labor se enfoca en implementar las búsquedas semánticas para darle relevancia a artículos y secciones editados por personas, sin generar nuevas respuestas o resúmenes.

Resultados de la investigación

El grupo de trabajo ha completado recientemente un informe que buscó comprobar si el problema planteado es real y si renovar la función de búsqueda podría verdaderamente ayudar a nuestros lectores y lectoras, para lo cual se apoyó en investigación de diseño, en prototipos técnicos y en la retroalimentación de la comunidad. Nuestros hallazgos confirmaron ambas conjeturas. En resumen:

  1. Cerca del 98% de las sesiones de lectura de Wikipedia se origina en búsquedas fuera de Wikipedia.
    • Es mucho más probable que quienes conforman el reducido grupo que utiliza la función de búsqueda interna sean editores en lugar de lectores casuales. La mayoría se mueve entre artículos mediante el motor externo, incluso cuando la propia Wikipedia contiene enlaces.
  2. Entre el 80% y el 95% de las búsquedas en la wiki utilizan las sugerencias automáticas.
    • La preferencia por estas recomendaciones, que aparecen conforme se ingresa algún término, demuestra que cualquier pequeña optimización de tiempo puede producir un gran impacto.
  3. Entre el 4% y el 7% de las búsquedas en Wikipedia se formulan como preguntas, aunque estas no sean muy efectivas.
    • A pesar de representar la minoría de las búsquedas, este dato demuestra que algunas personas intentan realizar búsquedas de esa forma, mientras que otras evitan hacerlo tras descubrir que ese modo no funciona.

Muy pronto: experimentación y conversación comunitaria

Sobre la base de nuestra investigación, creemos que un abordaje híbrido de búsqueda, que combina ambos tipos (por términos clave y por semántica), tiene el mayor potencial para encontrar información con mayor facilidad. En pruebas iniciales, esta combinación arrojó los resultados más relevantes y satisfactorios.

Nuestro próximo paso implica un experimento a pequeña escala, en el que probaremos la búsqueda híbrida en Wikipedia. Los resultados de este, junto con la retroalimentación que proporcionen editores y editoras, nos ayudarán a determinar si la búsqueda semántica debería formar parte de las herramientas de búsqueda de Wikipedia y de qué forma debería hacerlo.

Documentaremos el progreso del experimento en Meta-Wiki, en MediaWiki y publicaremos novedades mediante Village Pumps, tableros de noticias, llamadas comunitarias y otros eventos. Las opiniones de editores y editoras, en particular en relación a riesgos y concesiones, afectarán directamente al desarrollo, prueba o suspensión de la búsqueda semántica, así como al modo en que este desarrollo se efectuará.

El valor de Wikipedia está íntimamente ligado al conocimiento confiable y creado por humanos. Al mejorar la función de búsqueda, esperamos que más personas encuentren conocimiento, exploren los temas que les apasionan y así vuelvan a visitar nuestro sitio después.

Can you help us translate this article?

In order for this article to reach as many people as possible we would like your help. Can you translate this article to get the message out?