Onde os dados são armazenados?(){
i++

Por: Caroline Barcelos Gonçalves


Alguns números interessantes que dizem respeito a quantidade de dados existentes atualmente para te deixar intrigado:

  • Cerca de 2.7 Zetabytes (que são 27 seguidos de 21 0's) de dados existem atualmente 1. A previsão é que até 2020 a quantidade de dados aumentará em 50X o que é hoje.
  • A cada 2 dias, cria-se mais informações que toda a quantidade de informações entre o início dos tempos e o início de 2003.
  • Em 2012, 90% dos dados que existiam tinham sido criados nos últimos 2 anos.
A curiosidade é onde essa quantidade de informações são armazenadas. O que se sabe é que é preciso grande capacidade de armazenamento para tal tarefa. Existem diversas ferramentas na nuvem disponíveis para auxiliar as empresas no armazenamento desses dados. Citaremos algumas grandes corporações, o LHC (Large Hadron Collider - o maior acelerador de partículas do mundo, no Centro Europeu de Pesquisas Nucleares, na Suíça) e Facebook e falaremos sobre a infra-estrutura utilizada para armazenados e manipular esses dados e seus data centers.

O LHC, gera 15 petabytes de dados anualmente. O Centro de Dados deles processam cerca de um petabyte de dados a cada dia. Como não há recursos financeiros e nem computacionais para manipulação de dados no local criou-se uma intra-estrutura distribuída organizada em camadas para compartilhar a carga em diversos centros espalhados ao redor do mundo, chamada de grid. A imagem abaixo é do nível 0 das camadas do grid, com os servidores em uma área de 1450 m². Como apoio a capacidade computacional do LHC, o Wigner Research Centre for Physics em Budapest, Hungria opera como uma camada remota. O sistema principal (que fica na Suíca) fornece em média 45 petabytes de armazenamento de dados em disco, e inclui a maioria dos 100 mil núcleos de processamento do centro de dados, já o centro de dados de Wigner estenderá essa capacidade com 20.000 núcleos e 5,5 petabytes de dados em disco, e a tendência é só aumentar essa capacidade.

Servidores nivel 0 LHC

Área de 1450 m² onde se encontram os servidores no nível 0 do LHC

[Cern]

Algumas outras informações curiosas, o centro de dados do LHC abriga 11.000 servidores com 100.000 núcleos de processador, a estimativa é que 6000 mudanças no banco de dados são realizados a cada segundo. Outro número interessante é que em taxas de pico, 10 gigabytes de dados podem ser transferidas entre seus servidores por segundo.

O Facebook precisa de infraestrutura para, por exemplo, armazenar os 300 milhões de novas fotos que os usuários colocam todos os dias. Para suportar a atividade, a empresa conta com dois centros de dados e ainda tem mais dois sendo construídos, eles se encontram em Prineville em Oregon, Forest City na Carolina do Norte, Lulea na Suécia. Apenas a área em Prineville conta com 307 mil metros quadrados e a instalação na Carolina do Norte é aproximadamente do mesmo tamanho. A empresa não divulga quantos servidores possui, mas segundo informações de técnicos da empresa em algumas apresentações, a partir de junho de 2010 a empresa possuía pelo menos 60.000 servidores, imagine atualmente.

Referências:

A day in Big Data
The Facebook Data Center FAQ
Computing, CERN

}