Software R e Big Data(){
Software Livre

Por: Aryadne Guardieiro

Símbolo da linguagem R

Wordle: Untitled [Logo]

Na grade curricular dos cursos de estatística das maiores universidades do Brasil, a linguagem R teve origem na linguagem S, desenvolvida na de 70 na Bell Laboratories. Criada na universidade de Auckland, Nova Zelândia, em 1993 sob a licença GNU GPL ela continua recebendo colaborações da comunidade software livre desde então.

Linguagem de programação e ambiente de desenvolvimento integrado, R tem como objetivo realizar cálculos estatísticos e gráficos de forma elegante e otimizada. Devido a grande colaboração feita pela comunidade a linguagem R é altamente expansível, incluindo pacotes que lidam com processamento de Big Data.

A linguagem R se encontra no segundo lugar como ferramenta de Data Mining (Data Mining / Analytic Tools Used Poll (May 2010)), ficando à frente de ferramentas proprietárias como Excel, MatLab e Oracle DM.

O que muitas pessoas ainda não sabem é que essa linguagem também pode ser utilizada no processamento de Big Data. Pensando na utilização dessa ferramenta na exploração de grandes massas de dados, foi criado o pacote pbdR (Programming with Big Data in R) que integra o uso de computação paralela associada com a linguagem R. Esse pacote permite o controle de auto nível de recursos distribuídos e fornece escalabilidade aos programas escritos nessa linguagem.

E não é só de comunidade open source que vive a linguagem R. Grandes empresas também utilizam e colaboram com esse projeto. Em outubro de 2011, uma das empresas conceituadas no tratamento de dados, a Oracle, anunciou o Big Data Appliance, que integra R, Apache Hadoop, Oracle Linux e um banco de dados NoSQL.

Grandes empresas que oferecem serviços computacionais como Twitter, Facebook e até mesmo o jornal The New York Times também compraram essa ideia. Conheça mais sobre o uso da linguagem R no pequeno vídeo a seguir:

}