Cet article a été initialement publié en anglais sur Signpost le 27 février 2025
Lorsque vous cliquez sur le bouton “Modifier” sur un projet Wiki, vous pensez probablement à l’amélioration du contenu. Le processus semble fluide: Modifier, enregistrer, recommencer. Qu’il s’agisse de suivre les nouvelles modifications, de téléverser des photos ou de rejoindre une campagne, vous pouvez compter sur la plateforme Wikimédia pour être opérationnelle, dans votre langue, partout dans le monde. Sauf lors de quelques minutes pendant les équinoxes.
Deux fois par an, aux équinoxes, l’équipe d’ingénierie de fiabilité du site (SRE) de la Fondation Wikimédia effectue un basculement de serveur de centre de données, pour rediriger tout le trafic d’un serveur principal vers un autre. Il s’agit en quelque sorte d’une sauvegarde. Mais pourquoi? En cas de crise, nous pouvons compter sur l’autre centre de données.
Le processus de basculement planifié permet d’effectuer des opérations de maintenance et d’amélioration essentielles au centre de sauvegarde. Il permet également à l’équipe de tester ses procédures, de minimiser l’impact du temps de lecture seule et de travailler sur la fiabilité globale des sites.
Grâce à “Écouter Wikipédia”, un outil ludique qui transforme chaque modification en son et la visualise en temps réel sous forme de bulle flottante, vous pouvez entendre le basculement. Avant le début du basculement, vous entendrez le flux continu des sons de modifications. Mais ensuite, et pendant environ deux minutes, le son s’arrête, ce qui signifie que le système est entré en phase de lecture seule. Quand-est-ce que les sons reprennent? C’est le moment où les ingénieurs peuvent enfin souffler: C’est le signal clair que la partie la plus difficile du basculement est terminée et que la modification reprend. Regardez cette vidéo pour revivre ce moment extraordinaire.

Cette interruption rare est due au fait que toutes les Wikis de Wikimédia reposent sur un serveur conçu spécifiquement pour leurs besoins et géré par la Fondation Wikimédia. Cette configuration nous permet de préserver notre indépendance tout en offrant une expérience fiable aux utilisateurs du monde entier.
L’équipe SRE supervise un réseau mondial de sept centres de données répartis entre les États-Unis, Singapour, les Pays-Bas, la France et, plus récemment, le Brésil. Ces centres de données permettent aux articles et autres contenus de se charger rapidement, en toute sécurité et confidentialité, et d’être accessibles partout et à tout moment.
Au cœur de ce réseau se trouvent les deux groupes de serveurs d’applications qui hébergent les copies actives des projets. Il est indispensable d’avoir deux groupes de serveurs d’applications pour maintenir en activité toutes les Wikis que nous hébergeons: En cas de panne d’un serveur, le second peut prendre le relais, et inversement. Avec environ 342 modifications par minute sur Wikipédia uniquement, disposer d’un serveur de secours est nécessaire.
Si le basculement peut paraître simple, en réalité, le processus a considérablement évolué au fil des ans.
À chaque équinoxe, place au basculement
Depuis son lancement, le basculement du centre de données a été perfectionné et est devenu désormais largement automatisé. Ce qui prenait autrefois près d’une heure d’indisponibilité en lecture seule prend maintenant entre 2 et 3 minutes, un gain d’efficacité considérable. Mais comment en sommes-nous arrivés là?
Tout a commencé en 2015, lorsqu’une augmentation des dons a permis à la Fondation d’allouer un budget plus important à la création d’un deuxième centre de données capable d’héberger le cœur de notre écosystème, utilisant MediaWiki et tous les autres services nécessaires à son fonctionnement. Pour démontrer les capacités du nouveau centre de données, l’équipe SRE a dû tester la possibilité d’effectuer toutes les opérations à partir de cette nouvelle localisation.
Le premier basculement, qui a eu lieu en mars 2016, a été une entreprise de grande envergure. Il a nécessité six mois de préparation et le travail de dix ingénieurs. En plus des efforts de la préparation technique, la Fondation a partagé le calendrier de la migration via des bannières, sur le bistrot et d’autres canaux de communication, pour tenir ainsi tout le monde informé.
Au cours du processus, une limitation technique de MediaWiki a contraint l’équipe SRE à mettre les Wikis en lecture seule pendant 45 minutes, suivies de deux heures de performances quelque peu dégradées. Les Wikis sont restées accessibles, mais personne ne pouvait les modifier. Le transfert des opérations d’un centre de données “chaud”, gérant déjà un trafic important, vers un centre de données “froid”, a eu des conséquences notables. Le point essentiel à retenir? Une pratique régulière de basculement était essentielle.
En décidant de planifier des basculements réguliers, l’équipe souhaitait garantir que le centre de secours soit toujours prêt à reprendre l’ensemble des opérations en cas d’urgence. Après chaque basculement, le nouveau centre de données principal gère l’intégralité du trafic pendant une semaine, ce qui laisse le temps aux opérations de maintenance et d’amélioration essentielles du centre secondaire. Cela permet également à l’équipe de tester ses procédures, de réduire l’impact du temps de lecture seule et de travailler sur la fiabilité des sites.
Pourquoi l’équinoxe?

Le fait de choisir un événement mémorable, qui ne change pas particulièrement selon les cultures, les pays, les hémisphères, les juridictions, etc., permet à davantage de personnes de s’en souvenir et de s’y identifier, ce qui le rend plus adapté à notre mouvement global. Les choses créées par les humains ont tendance à varier considérablement et à avoir des connotations différentes (y compris négatives) selon les cultures. Nous avons donc opté pour un événement quasi constant pour l’humanité depuis des temps immémoriaux. Il s’agit d’un événement astronomique prévisible depuis des millénaires: L’équinoxe solaire.
Les Wikimédiens attentifs remarqueront certainement que le trafic n’est pas redirigé précisément le jour de l’équinoxe, mais le mercredi de la semaine où il se produit, car cela nécessite un certain travail de préparation. Mais c’est une date facile à retenir pour tous, que ce soit les rédacteurs, les affiliés organisant des événements ou les développeurs qui améliorent le code source de la plateforme.
La décision d’aligner la migration du système sur les équinoxes est à la fois pratique et un clin d’œil à la passion d’Alexandros Kosiaris, ingénieur principal en fiabilité des sites, pour l’astronomie. Les équinoxes ne sont pas seulement un choix fonctionnel: Ils sont aussi irrésistibles, car ils marquent un rythme naturel qui résonne au sein des membres de l’équipe. Comme ils aiment le dire, les modifications “volent vers le nord au printemps et vers le sud à l’automne”, reflétant la migration des oiseaux entre les centres de données.
Afin de renforcer la résilience de ce processus et de s’assurer que toutes les personnes compétentes maîtrisent son fonctionnement, c’est le membre le plus récent de de l’équipe gère la migration. Un rite de passage qui garantit une documentation complète du processus, une facilité de suivi et une expérience pratique de l’une des opérations les plus critiques. C’est aussi un rappel que derrière l’expérience de rédaction des projets Wikimédia se cache une équipe d’ingénieurs dévoués, en constante évolution.
La prochaine fois que vous cliquerez sur “Modifier”, sachez que derrière cette simple action se cache un réseau soigneusement entretenu qui intègre votre contribution au savoir partagé mondial; une collaboration humaine et technologique qui assure le fonctionnement de l’ensemble du système, invisible mais essentielle.
Pour être à jour par rapport au prochain basculement des serveurs, écoutez les Wikis le mercredi 19 mars 2025 à 14h00 GMT.

Pouvez-vous nous aider à traduire cet article ?
Pour que cet article soit diffusé au plus grand nombre, nous avons besoin de votre aide. Pouvez-vous traduire cet article pour faire passer le message ?
Commencer la traduction