¿Lo has oído? Las wikis se callan dos veces al año.

Translate this post

Este artículo fue publicado originalmente en Signpost el 27 de febrero de 2025.

Dos veces al año, alrededor de los equinoccios, el equipo de Ingeniería de Fiabilidad del Sitio (SRE) de la Fundación Wikimedia realiza un cambio de servidores en el centro de datos, redirigiendo todo el tráfico de un servidor principal a otro, que esencialmente funciona como respaldo (back up). ¿Por qué? Porque en caso de una crisis, podemos depender del otro centro de datos.

Cuando haces clic en el botón de “editar” en una wiki, probablemente estás enfocada o enfocado en mejorar el contenido. El proceso se siente fluido: editar, guardar, repetir. Desde patrullar nuevas ediciones hasta subir fotos o unirte a una campaña, puedes contar con la plataforma Wikimedia para que esté en funcionamiento en cualquier parte del mundo y en tu idioma, excepto por un par de minutos durante los equinoccios.

Ingeniería de Fiabilidad del Sitio (SRE)

El proceso de conmutación programada no solo permite realizar tareas de mantenimiento y mejoras esenciales en el centro de respaldo sino que también permite al equipo probar sus procedimientos, minimizar el impacto del tiempo de sólo lectura y trabajar en la fiabilidad general de los sitios.

Gracias a Listen to Wikipedia, una herramienta lúdica que convierte cada edición en un sonido y la visualiza como una burbuja flotante en tiempo real, puedes oír realmente cómo se produce el cambio. Antes de que empiece el cambio, oirás un flujo constante de sonidos de edición. Pero entonces, a los 2 minutos aproximadamente, el sonido se detiene, lo que significa que el sistema ha entrado en la fase de sólo lectura. ¿Y cuándo vuelve a sonar? Ese es el momento en que los ingenieros pueden respirar por fin: es la señal inequívoca de que la parte más difícil de la conversión. Mira este video para poder vivir ese extraordinario momento.

Listen to Wikipedia – 2014-06-26.

Esta rara interrupción ocurre porque todas las wikis de Wikimedia dependen de un servidor diseñado específicamente para sus necesidades y gestionado por la Fundación Wikimedia. Esta configuración nos permite seguir siendo independientes, al mismo tiempo que ofrecemos una experiencia confiable para usuarios y usuarias de todo el mundo.

El equipo de SRE supervisa una red global  de centros de datos, siete en total, ubicados en Estados Unidos, Singapur, Países Bajos, Francia y, más recientemente, Brasil. Estos centros de datos permiten que los artículos y otros contenidos se carguen de manera segura, privada y rápida, y puedan ser accesibles en cualquier momento y lugar.

En el corazón de esta red se encuentran los dos grupos de servidores de aplicaciones que alojan las copias en vivo de todos los proyectos. Contar con dos grupos de servidores de aplicaciones es fundamental para mantener activas todas las wikis que alojamos: si un servidor falla, el segundo puede tomar el control y viceversa. Con un estimado de 342 ediciones por minuto solo en Wikipedia, tener un servidor de respaldo (backup) es imprescindible.

Si bien el cambio de servidor puede parecer simple, la realidad es que el proceso ha evolucionado significativamente a lo largo de los años.

Cada equinoccio es hora de cambiar

Desde su inicio, el cambio de centro de datos se ha ido perfeccionando y ahora está, en gran medida, automatizado. Lo que antes requería casi una hora de inactividad en modo de solo lectura ahora toma entre dos o tres minutos, un avance significativo en la eficiencia. Pero, ¿cómo llegamos hasta aquí?

Todo comenzó en 2015, cuando un aumento en las donaciones permitió a la Fundación Wikimedcia asignar un presupuesto mayor para establecer un segundo centro de datos capaz de albergar el núcleo de nuestro ecosistema, utilizando MediaWiki y todos los demás servicios que la hacen funcionar. Para demostrar las capacidades del nuevo centro de datos, el equipo de SRE tuvo que probar que todas las operaciones podían ser gestionadas completamente desde esa nueva ubicación.

En marzo de 2016, el primer cambio de centro de datos resultó un gran desafío. Requirió seis meses de preparación y el esfuerzo de diez ingenieros. Más allá del trabajo técnico, la Fundación Wikimedia compartió el cronograma del cambio a través de banners, en el Café y en otros canales de difusión, para mantener a todos y todas informados e informadas.

Una limitación técnica en MediaWiki obligó al equipo de SRE a poner las wikis en modo de solo lectura durante 45 minutos, seguidos de dos horas de rendimiento degradado, durante ese proceso. Las wikis siguieron siendo accesibles, pero nadie podía editarlas. Cambiar las operaciones de un centro de datos “caliente” —que ya manejaba un tráfico significativo— a un centro de datos “frío” tuvo impactos notables. ¿La lección fundamental? Resultaba esencial realizar una práctica regular del cambio de centro de datos.

El equipo quería garantizar que el centro de respaldo siempre estuviera preparado para asumir todas las operaciones en caso de emergencia y por eso decidió programar los cambios de centro de datos de manera regular. Después de cada cambio, el nuevo centro de datos principal maneja todo el tráfico durante una semana, lo que permite realizar el mantenimiento esencial y las mejoras en el centro secundario. También permite al equipo probar sus procedimientos, reducir el impacto del tiempo en solo lectura y mejorar la fiabilidad de los sitios.

¿Por qué el equinoccio?

Imagen satelital durante el equinoccio de septiembre.

Elegir algo memorable que no varíe demasiado entre culturas, países, hemisferios y jurisdicciones permite que más personas lo recuerden y se identifiquen con ello, lo que lo hace más adecuado para nuestro movimiento global. Las creaciones humanas tienden a variar mucho y a tener diferentes connotaciones, incluidas algunas negativas, según la cultura, por lo que elegimos algo que ha sido una constante para la humanidad desde tiempos inmemoriales. Se trata de un evento astronómico que ha sido predecible por la humanidad durante milenios: el equinoccio solar.

Los wikimedistas más observadores notarán que el tráfico no se redirige exactamente en el día del equinoccio, sino el miércoles de esa semana, ya que se necesita cierto trabajo de preparación, pero es fácil de recordar para todos y todas, ya sean editores o editoras, o afiliados que organizan eventos o desarrolladores y desarrolladoras que mejoran la base de código de la plataforma.

La decisión de alinear el cambio de sistema con los equinoccios responde tanto a la practicidad como a un guiño a la pasión por la astronomía de Alexandros Kosiaris, Ingeniero Principal de Confiabilidad del Sitio. Los equinoccios no solo son una elección funcional, sino también irresistible, ya que marcan un ritmo natural que resuena con el equipo. Como les gusta decir, las ediciones “vuelan hacia el norte en primavera y hacia el sur en otoño”, reflejando la ruta migratoria de las aves entre los centros de datos.

Para fortalecer este proceso y asegurarse de que todas las personas adecuadas sepan cómo ejecutarlo, el miembro más nuevo del equipo lidera el cambio de centro de datos. Es un rito de iniciación que garantiza que el proceso esté bien documentado, sea fácil de seguir y brinde experiencia práctica en una de las operaciones más críticas. También es un recordatorio de que detrás de la experiencia de edición de los proyectos Wikimedia hay un equipo de ingenieros e ingenieras dedicados y dedicadas, que aprenden y mejoran constantemente.

Así que, la próxima vez que hagas clic en “editar”, recuerda que detrás de esa simple acción hay una red cuidadosamente mantenida que hace que tu contribución forme parte del conocimiento compartido del mundo: una colaboración entre personas y tecnología que mantiene todo el sistema en funcionamiento, invisible pero esencial.

Si quieres estar atento o atenta al próximo  cambio de servidor, escucha Listen to Wikipedia el miércoles 19 de marzo de 2025 a las 14:00 UTC.

Can you help us translate this article?

In order for this article to reach as many people as possible we would like your help. Can you translate this article to get the message out?