O Big Data foi fundamentado em 3 Vs, que utilizamos como base para classificar o momento no qual estamos ou não trabalhando no mundo Big Data.
Neste artigo vamos ver conhecer estes fundamentos e como identificá-los.
Big Data é um termo utilizado para tratar e definir grandes volumes de dados que precisam ser armazenados e processados.
Para entender melhor o que é Big Data, suas aplicações e história, acesse este link.
Para entender os fundamentos, vamos ver a seguir.
Os 3 Vs do Big Data:
Volume:
Diz respeito a grande quantidade de dados, de fontes variadas.
Dependendo do caso de uso, o volume dos dados podem ultrapassar a barreira dos petabytes.
Por exemplo, a origem pode ser bancos de dados relacionais, dados não estruturados, redes sociais, imagens, vídeos, sons, arquivos de logs e qualquer outro dado que possa ser armazenado e processado.
Velocidade:
É uma das principais características do Big Data, pois a medida que o volume de dados foi aumentando, a tecnologia evoluiu e o uso de recursos tecnológicos cresceu.
Junto com este, a expectativa da experiência do usuário com este novo universo de dados/informações precisou de uma taxa de processamento e gerenciamento mais rápido.
Inegavelmente começamos a falar em real time(tempo real) e, em alguns casos, near real time (próximo ao tempo real).
Variedade:
Big Data também pode ser classificado como Any Data (qualquer dado), pois hoje temos a capacidade de coletar, armazenar e processar dados de diversos formatos, sendo estes estruturados, semi-estruturados ou não estruturados.
Os dados podem ser de qualquer tipo: textos, dados de sensores, vídeos, sons, dados geoespaciais, logs, redes sociais, bancos de dados, entre outros.
Contudo, o processamento desta heterogeneidade de dados gerou a necessidade do desenvolvimento de novas tecnologias capaz de coletar, processar e armazenar estes, afim de obter significado e dar suporte a metadados.
Os 5Vs do Big Data!
Todavia, com o passar do tempo, foi incluído mais 2 Vs na definição de Big Data:
Valor e Veracidade.
Valor:
Um dos desafios de quem trabalha com Big Data é gerar valor aos dados.
A geração de valor com dados é dar significado à estes, para que o negócio possa utilizar estas informações e ser mais competitivos.
Ser mais competitivo é colocar-se a frente da concorrência no mercado, e usar os dados para agregar valor às análises com os resultados obtidos.
Veracidade:
É preciso classificar quais os dados são os verídicos, quais os que respondem a necessidade do negócio e quais correspondem com a realidade atual.
É comum encontrar dados errados e/ou que não condizem com a verdade deste momento e o desafio no trabalho com Big Data é encontrar os dados verdadeiros, separando o joio do trigo!
Contudo, Big Data é um grande conjunto de dados, que podem ser ou não complexos, com dados originados em diversas fontes e que precisam ser processados o mais rápido possível.
Esses conjuntos de dados são tão volumosos que os softwares “tradicionais” de processamento de dados simplesmente não conseguem gerenciá-los.
No entanto, esses grandes volumes de dados podem ser usados para resolver problemas de negócios que não conseguiríamos resolver antes.
A resolução destes problemas agora é possível, mas fazendo necessário uma nova abordagem(novas tecnologias) para a geração de valor.
A definição do termo Big Data não é tão simples, assim como o conceito, as diversas ferramentas e estudos que o acompanham.
Isoladamente podem ser simples, mas o grande segredo é saber como combiná-las para atender as necessidades das organizações.
Esta é uma pequena contribuição dos meus conhecimentos. Espero ter ajudado, afinal, é sempre bom dar uma ajudinha…