Como o novo centro em São Paulo já está diminuindo o tempo de carregamento da Wikipédia.
Um segundo atrás, pessoas ao redor do mundo acessaram a Wikipédia 5.500 vezes.
O que essas pessoas provavelmente não sabem é que o que apareceu em suas telas veio por meio de um centro de processamento de dados (CPD) administrado pela e de propriedade da Fundação Wikimedia, a organização sem fins lucrativos responsável pela Wikipédia e outros Projetos Wikimedia. A rede global de centros de processamento de dados da Fundação torna o carregamento de artigos da Wikipédia e outros conteúdos da Wikimedia rápido, seguro e privado, independentemente de onde você está no nosso planeta.
A Fundação recentemente inaugurou um novo centro de processamento de dados em São Paulo, Brasil. Este é mais recente centro a entrar em funcionamento entre os sete centros de processamento de dados da Fundação Wikimedia no mundo inteiro e é o primeiro centro na América do Sul. Como resultado do novo centro, o tempo médio que uma pessoa leitora no Brasil leva para carregar a Wikipédia diminuiu em um terço de segundo. Isso é importante, porque o tempo que leva para carregar uma página pode deixar alguém frustrado e consequentemente menos propenso a usar a Wikipédia no futuro.
Inaugurar um centro de processamento de dados é fascinantemente complexo. Cerca de 12 funcionários da Fundação Wikimedia passaram mais de dez meses lidando com questões jurídicas, barreiras regulatórias, atrasos prolongados na entrega de equipamentos e funcionários instalando fisicamente servidores no centro de processamento de dados para tornar o novo centro possível.
Vamos ver em maiores detalhes como a Fundação realizou esse projeto.
O que é um centro de processamento de dados? Por que há “servidores” nele?
Você já deve ter assistido um dos muitos filmes de Hollywood onde o personagem principal precisa invadir uma sala com um monte de torres eletrônicas bem arrumadas e instalar um dispositivo para destruir os planos malignos do vilão. Veja Tron o Legado ou Missão: Impossível, por exemplo.
A precisão dessas cenas fictícias pode deixar a desejar, mas mesmo assim elas conseguem transmitir a seguinte ideia: os personagens estão conectando esses dispositivos a servidores individuais que armazenam os dados digitais de uma plataforma e, quando esses servidores são conectados em rede, você tem um centro de processamento de dados. Na vida real, sempre que você tenta acessar uma página na Wikipédia, a solicitação de acesso vai para o centro de processamento de dados da Fundação Wikimedia mais próximo de você que envia as informações para seu dispositivo.
Como funcionam os centros de processamento de dados da Fundação Wikimedia? Por que são importantes?
A Fundação Wikimedia mantém sete centros de processamento de dados localizados nos Estados Unidos, Cingapura, Holanda, França e agora também no Brasil.
A maioria desses centros de processamento de dados disponibiliza versões “em cache” do conteúdo da Wikimedia. Isso significa que os centros de processamento de dados tentam manter uma cópia desse conteúdo em arquivo depois que uma pessoa o abre pela primeira vez. Essa prática nos permite responder rapidamente a qualquer página que você queira carregar e enviá-la a você com o mínimo de demora.
Mesmo assim, é impossível superar as limitações físicas da distância. Antes de inaugurar um centro de processamento de dados no Brasil, alguém que mora no Rio de Janeiro levava o dobro do tempo para carregar um artigo da Wikipédia do que alguém na cidade de Nova York porque estava muito mais longe do centro de processamento de dados mais próximo.
Como parte do nosso compromisso com a equidade do conhecimento, a Fundação Wikimedia vem instalando de forma constante servidores fora dos Estados Unidos desde 2012. Cada novo local diminui o tempo médio de carregamento de todas as regiões às quais está conectado.
O que é necessário para inaugurar um novo centro de processamento de dados?
Muita coisa. Vamos dar uma olhada.
Certo, vamos começar com as questões jurídicas.
Em primeiro lugar, a Fundação precisa selecionar um local para um novo centro de processamento de dados. Esse processo implica em meses de trabalho por parte da nossa equipe jurídica que examina as leis e regulamentações que regem cada local candidato a sediar esse centro. Os sites da Wikimedia coletam apenas uma quantidade extremamente pequena de dados pessoais de pessoas que visitam esses sites, e, portanto, qualquer local que a Fundação selecionar precisa atender os nossos altos padrões de privacidade. A equipe jurídica também precisa determinar respostas para questões mais mundanas, como obrigações fiscais.
Não é coincidência que isso tudo é muito semelhante ao motivo pelo qual a Fundação opera seus próprios centros de processamento de dados, num momento em que grande parte da indústria de tecnologia tem migrado para a computação em nuvem. Para a Wikimedia, é uma escolha simples: acreditamos na privacidade do usuário e da usuária e acreditamos que você deve poder ler qualquer coisa em nossos sites sem temer que uma empresa, governo ou qualquer outra pessoa esteja bisbilhotando para saber aquilo que lhe interessa.
Além de tudo isso, o centro de processamento de dados em São Paulo apresentou novos desafios à Fundação, uma vez que tivemos que identificar fornecedores dispostos a trabalhar conosco, apesar de não estarmos listados no Cadastro Nacional de Pessoas Jurídicas (CNPJ). Isso impactou nossas compras de equipamentos, nossos planos de entrega do centro e até mesmo nossa aquisição de endereços IP.
O que mais é necessário para selecionar um local?
Os centros de processamento de dados da Fundação Wikimedia precisam estar situados em ou próximos a uma cidade onde vários cabos de comunicação submarinos chegam à costa. Esses cabos de fibra ótica passam ao longo do fundo do oceano em todo o mundo e são a espinha dorsal da internet.
Como construir um centro de processamento de dados?
Com uma equipe da Fundação Wikimedia que trabalhou muito e um sonho!
Cada centro de processamento de dados requer uma quantidade significativa de hardware físico que precisa ser comprado e enviado para o local desejado. Isso inclui:
- Hardware físico como servidores, roteadores, switches, cabeamento e energia
- O provedor de colocation do centro de processamento de dados
- Circuitos de rede como peering, transporte e trânsito com redundância
Este trabalho é mais complicado hoje do que nos primórdios da Wikipédia. Mas o foco contínuo da Fundação Wikimedia procurando sempre melhorar a infraestrutura técnica significa que a Fundação agora pode se preocupar menos em relação à quando e com que frequência a Wikipédia poderá sofrer problemas e ficar fora do ar. Em vez disso, a Fundação pode direcionar seus recursos para melhorar a experiência vivida por pessoas leitora e editoras ao redor do mundo, como reduzir seus tempos de carregamento.
Infelizmente, todo esse equipamento não se instala por conta própria. Os servidores não se colocam sozinhos em racks, nem conseguem se conectar às portas corretas ou trocar cabos que se mostrem defeituosos por conta própria. Também não conseguem rotular as portas para garantir que qualquer pessoa que faça uma manutenção futura nesses servidores entenda como e por que eles estão conectados. Em vez disso, para cada centro de processamento de dados que a Fundação inaugurou nos últimos anos, os membros da equipe da Fundação foram a cada local para montar tudo.
Ter pessoas da equipe no local durante o processo de instalação também ajuda muito quando alguém precisa apresentar soluções para quando — e não se — as coisas derem errado.
Por exemplo, para montar o centro de processamento de dados de São Paulo, a Fundação enviou quatro paletes repletos de equipamentos para os membros da equipe instalarem durante uma semana. Os três primeiros paletes foram liberados pela alfândega e chegaram no centro de processamento de dados na data prevista. O quarto palete, que incluía todos os roteadores, switches e cabos da equipe, atrasou devido a questões de documentação obrigatória e aprovações pendentes. Este palete só chegou no último dia planejado para os membros da equipe trabalharem e a equipe conseguiu realizar o equivalente de 2 a 3 dias de trabalho nas últimas 12 horas antes de embarcarem em seus voos de volta para casa.
Inaugurar um novo centro de processamento de dados da Wikimedia é um trabalho complexo e delicado. Doze membros da equipe passaram mais de 1.600 horas num período de dez meses estudando questões jurídicas, selecionando um local, identificando fornecedores dispostos a trabalhar conosco, encomendando todo o equipamento e garantindo o envio para o destino certo, e mesmo que alguns equipamentos não tenham chegado na data prevista, conseguiram instalar tudo em tempo hábil. E isso é apenas o começo da jornada. Esperamos que este centro de processamento de dados forneça acesso rápido e confiável à Wikipédia em toda a região por muitos anos no futuro.
Este é apenas um dos motivos pelos quais a Fundação Wikimedia existe. A Fundação assume tarefas difíceis nos bastidores para que pessoas em todos os lugares possam contribuir para e acessar a soma de todo o conhecimento.
Can you help us translate this article?
In order for this article to reach as many people as possible we would like your help. Can you translate this article to get the message out?
Start translation