¿Por qué editar Wikipedia en la época de las IAs?

El enfoque WikiUNLP
El Equipo de Wikimedistas de la Universidad Nacional de La Plata (WikiUNLP) promueve comunicar el conocimiento científico y practicar la Ciencia Abierta por medio del uso de los proyectos Wikimedia. Haber elegido los proyectos Wikimedia no fue un acto fortuito sino el encuentro de científicos y académicos buscando un espacio colaborativo para democratizar el conocimiento de manera cooperativa y eficiente, con impactos medibles y especialmente altos. Los proyectos Wikimedia representan un espacio internacional, multilingüe, multicultural, abierto, libre y sin fines de lucro que tiene como utopía compartir todo el conocimiento de la humanidad, principios que están en plena coincidencia con nuestra visión de la gestión del conocimiento. El crecimiento vertiginoso de Wikipedia, Wikimedia Commons, Wikidata y otros, dan cuenta de que la apertura a la gestión colaborativa de los contenidos resultó en un éxito sin precedentes: cientos de millones de elementos (artículos de Wikipedia, imágenes en Wikimedia Commons, registros de Wikidata, y otros) liberados para el uso libre de la humanidad.
Pero el conocimiento es un bien cultural que, en parte, refleja nuestra diversidad, pero que también está signado por los acontecimientos históricos y las relaciones de poder actuales. El movimiento Wikimedia desarrolla políticas activas con el fin de reducir los desequilibrios observados en los mismos proyectos, que tienen su origen en los desequilibrios propios del conocimiento (geopolíticos, de género, étnicos y otros). Busca también enriquecer al colectivo de editores de sus proyectos, sumando diversidad y, también, especialistas en el conocimiento (i.e., integrantes de instituciones científicas y educativas). A su vez, intenta promover la confianza sobre los contenidos y su uso. La Fundación Wikimedia encontró a la propuesta de WikiUNLP en franca coincidencia con sus iniciativas, tanto que aportó, ya por tercer año consecutivo, financiamiento a nuestro proyecto.

Tejer redes para fortalecer el conocimiento
Es en este marco que quienes integramos WikiUNLP, en gran parte antes de que este grupo exista, comenzamos a navegar por las aguas comunes entre el Conocimiento Libre, con Wikimedia como principal proyecto, los preceptos de la Ciencia Abierta y nuestros conocimientos especializados, todo ello en actividades de investigación, docencia y comunicación de la ciencia. En el trayecto recorrido encontramos que las instituciones académicas y científicas se pueden ver beneficiadas por el uso de los proyectos Wikimedia: como parte de la infraestructura para sus iniciativas en el marco de la Ciencia Abierta, mientras que grupos de investigación, cátedras, colectivos de estudiantes y graduados, pueden mejorar sus capacidades académicas, al mismo tiempo dejan en Wikimedia miradas más adecuadas de los aspectos naturales y culturales de nuestras regiones, compartiendo costumbres, visibilizando lugares, rasgos y otros aspectos autóctonos. Y en eso estamos, trabajando en el enlace entre los proyectos Wikimedia y nuestro ámbito de desempeño profesional.
Tempranamente en nuestra trayectoria, detectamos que, por una parte, el trabajo paciente y detallado en proyectos específicos relacionados con la gestión digital de archivos, bibliotecas, colecciones de museos y relacionados, tiene un potencial tanto en la visibilización de los proyectos dentro de la Universidad Nacional de La Plata como fuera. Por la otra, notamos que por cada propuesta dentro de nuestra Universidad, recibíamos muchas más de otras instituciones, incluso acompañadas por mayores niveles de entusiasmo. De ello surgió la necesidad de organizar una estructura que excediera a nuestra casa de estudios, y que promoviera la interacción entre la ciencia desd|e el modelo de Ciencia Abierta, y los proyectos Wikimedia. Impulsamos esta iniciativa con el formato de Red, la Red de Wikimedistas en Ciencia Abierta (Red WikiCA), y nos planteamos la intención de generar capacidades en cada integrante, buscando su autonomía, y detrás de ello, la constitución de nodos. Eventualmente, algún nodo diferente a WikiUNLP podría asumir la conducción de la Red WikiCA. La Red WikiCA ha tenido logros muy destacables, tanto en el marco del trabajo con la comunidad (proyecto Chagas, proyecto Playas Doradas) como en la creación de nodos. En 2025 el nodo “Bahía Blanca” obtuvo su propio subsidio rápido de la Fundación WIkimedia, una gran noticia.



Cambios de paradigma
Ahora bien, el entorno digital no es estable y los significados cambian. Mientras que hace diez años planteábamos la pregunta de si Wikipedia era una fuente confiable, detrás de habilitar debates epistemológicos acerca de la gestión y legitimación del conocimiento, buscando derribar algunos prejuicios de nuestros colegas y estudiantes, imperceptible pero rápidamente esa pregunta perdió relevancia y nos encontramos con que se trasladó a la confiabilidad sobre los chatbots asociados a los modelos de lenguaje (Chat GPT, Deepseek, Perplexity, Gemini y otros). ¿Tiene sentido nuestro proyecto en este nuevo ecosistema?
Los modelos de lenguaje se nutren (una metáfora más adecuada que la idea de entrenamiento), de múltiples fuentes de información, entre las que los proyectos Wikimedia, especialmente Wikipedia, son muy significativos. Tanto es así que la Fundación Wikimedia ofrece un paquete de datos especial para el entrenamiento de los modelos de lenguaje, buscando evitar que los accesos frecuentes atenten contra la velocidad de los servicios que ofrece (acceso a los proyectos Wikimedia),. Notablemente, ese paquete se ofrece en inglés y francés, no en español, portugués o alemán, hecho que despierta inquietudes acerca del recorte elegido para esta acción, los sesgos que contiene y sus consecuencias sobre la información que reciben los usuarios argentinos, uruguayos, brasileros o de otros países surglobales cuando consultan a estos chatbots. No es que dicho paquete sea LA fuente de los sesgos de los grandes modelos de lenguaje (ni la única ni la más importante). Los modelos elaboran respuestas a partir de información disponible, y a nadie se le escapa que esa información está dominada cuantitativa y cualitativamente por fuentes del norte global. Las evaluaciones de los modelos de lenguaje alertan sobre el achatamiento y simplificación de la cultura, con un sesgos en favor de procedencias específicas, asociadas a lo que se conoce como norte global.
El objetivo de mejorar las características del Conocimiento Libre, es decir, trabajar sobre los desequilibrios no deseados (geopolíticos, de género y otros) no pierde relevancia frente al advenimiento de los grandes modelos de lenguaje, sino que se traslada al trabajo sobre los modos de aportar a dichos modelos.
Horizontes a futuro
Aparecen en este punto, al menos dos líneas de acción. La primera puede describirse como una militancia orientada a mejorar el conocimiento de las fuentes de información con las que se entrenan las IAs, y a trabajar para que estas reflejen la diversidad cultural y natural de nuestro planeta. Como segunda, aparece en el horizonte la iniciativa de desarrollar grandes modelos de lenguaje de carácter académico y corte regional, nutridos por fuentes elegidas y definidas, como es el caso de Latam GPT. Buenas versiones de Wikipedia, Wikidata y Wikimedia Commons, serían fuentes de entrenamiento para estos proyectos.
Can you help us translate this article?
In order for this article to reach as many people as possible we would like your help. Can you translate this article to get the message out?
Start translation