Hadoop(){
Software Livre

Por: Patrícia Mariana Ramos Marcolino

Hadoop

Hadoop

[hp]

A necessidade de armazenamento de dados em grande velocidade vem crescendo cada vez mais hoje dia, o que baseia-se nos 5 V’s do BIG DATA, sendo eles: velocidade, volume, variedade, veracidade e valor. Dados esses fatos, o desenvolvimento de software livres para cuidar dessa massa de dados, impulsionou a criação do Hadoop, sendo ele inspirado em artigos da Google que descreviam formas de tratar esse grande suporte de dados.

Apache Hadoop, um servidor de web livre, é totalmente open source. Foi criado por Doug Cutting, arquiteto chefe da Cloudera, onde o nome do software foi baseado em um bichinho de pelúcia de seu filho. O seu funcionamento é de forma de processamento distribuído e paralelo de grande quantidade de dados, sendo escalável e sem limites. Pode suportar qualquer tipo de dados como estruturado, não organizado, arquivos, imagens, áudio, praticamente qualquer tipo de dado independente de seu formato.

Em seis meses de funcionamento, o Hadoop se tornou uma parte fundamental no Yahoo, e em dois anos ganhou mais espaço no mercado. A empresa utiliza o apache para acompanhar o comportamento das pessoas, e com isso, selecionar o conteúdo mais visitado para o alterar o homepage com essas informações. Além de colocar anúncios em determinados conteúdos.

Por ser um código aberto, e devido ao desempenho do Hadoop, empresas como a Microsoft, Facebook, Eyealike, Autodesk utilizam-no.

Há também o site Big Data University que contribui com o ensinamento do Hadoop, além de outros cursos. Seu material é disponibilizado por pessoas do mundo inteiro.

Se gostou do programa e não sabe por onde começar, a printf te dá um auxilio: a Cloudera fornece tutoriais em texto. Basta acessar os links abaixo para acessar esse conteúdo:

Existem outras ferramentas que permitem uma análise mais personalizável dos dados, mas que exigem mais conhecimentos estatísticos e computacionais. A seguir, veja como usar a linguagem R no processamento de Big Data escrevendo seus próprios programas e o que essa poderosa linguagem livre pode oferecer.

Referências:

Cloudera

Wiki Big Data

Tecnologia.terra

}