Big Data e os 5V’s

Avatar


13 de agosto3 min. de leitura

Olá meu querido aluno,

Aqui é o Prof Almeida Júnior. Hoje vamos falar sobre um assunto que tem caído muito nas provas de concurso. E ele tem caído em praticamente todas as áreas. Seja na área fiscal, na área policial ou na área de controle, esse assunto tem aparecido tangenciando o assunto de banco de dados e/ou teoria da informação.

O tema de hoje é big data. Como o próprio nome sugere, a gente está falando de uma grande quantidade de dados e essa característica é de fato o cerne da questão. Hoje em dia, o volume de dados é muito grande. Por isso, existe um grande desafio de como lidar com essa enorme quantidade de informação.

Para definir banco de dados, geralmente usamos os 5 V’s. Esse 5 V’s são as iniciais para às 5 palavras que vamos discutir agora.

O primeiro V vem de Volume. O termo volume quer dizer que temos uma grande quantidade de dados. Por exemplo, agora mesmo estamos subindo este post para a internet. Milhares de pessoas estão fazendo a mesma coisa nas suas redes sociais. Note também que a todo momento temos vídeos novos sendo subidos no YouTube. Tudo isso gera um grande volume de informação. Ou seja, cada dia temos mais e mais informações espalhadas na internet. Desas forma, o desafio é encontrar uma maneira de como lidar com essa enorme quantidade de dados. Por  isso, falar em big data implica em valor em grande volume de dados.

O segundo V tem relação com a Velocidade. Ou seja, precisamos ter velocidade para processar essa grande quantidade de informação. Imagine que você queira utilizar a informação do Google Maps e de outros outras fontes de dados para tentar se localizar de forma automática. Por exemplo, imagine que construímos um aplicativo que é capaz de dirigir o nosso carro. Note para que o programa possa utilizar as informações, elas devem ser entregues no momento exato. Talvez com algum pequeno atraso. Imagine que  um semáforo está vermelho. Logo,  o carro terá que parar. Para se útil, a informação tem que chegar a tempo para o programa seja capaz de tomar a decisão correta. Assim a velocidade do processamento de informações é um fator decisivo do big data.

O outro termo é  Variedade. Com variedade, queremos dizer que temos uma grande diversidade de dados. Note que as informações podem ser em áudio, vídeo, fotos, textos, etc. Basta olhar para as redes sociais. Toda hora estamos carregando novas informações e dos mais variados tipos. Assim temos uma grande diversidade de dados. Os dados também podem vir de bancos de dados tradicionais. Esses dados são chamamos de dados estruturados. Contudo, outras fonte são utilizadas. Essas fontes são chamadas de não estruturadas. É o caso de planilhas do Excel, arquivos do Word, fotos, áudio, texto na internet, etc .

O próximo V vem de Veracidade. Isso quer dizer que é necessário que a informação seja real, segura, verdadeira. Ou seja, os líderes e gestores poderão confiar nas informações. Lembre-se que estamos em uma era onde se fala muito de fake news. Nada adianta um grande volume de informação que é falso. Portanto, a veracidade torna-se um fator decisivo na análise do big data.

Por fim, o último V é o de Valor.  Valor nos faz pensar a informação como um ativo. De fato, muitas empresas vivem basicamente de informação. Também não podemos pensar hoje em dia em uma empresa que não tenha na sua estrutura de negócio alguma relação com a tecnologia da informação. Por exemplo, diversas empresas fornecem seus serviços de venda por meio de web sites.

Usamos essas 5 características na tentativa de definir o que seria big data contudo diferentes autores possui diferentes conceitos. Por exemplo, podemos dizer que big data está relacionado aos dados que necessitam de uma capacidade de processamento além do processamento convencional dos bancos de dados tradicionais. Muitos autores também definem big data como um grande volume de dados que necessita de novas tecnologias para o seu tratamento. Com isso é preciso ter cuidado na hora da prova para perceber qual é a definição que o examinador está cobrando.

Vejamos agora algumas questões de como esse tema vem sendo cobrado.

(CEBRASPE/Escrivão de Polícia Federal/2018) Em um big data, alimentado com os dados de um sítio de comércio eletrônico, são armazenadas informações diversificadas, que consideram a navegação dos usuários, os produtos comprados e outras preferências que o usuário demonstre nos seus acessos.

Tendo como referência as informações apresentadas, julgue o item seguinte.

O big data consiste de um grande depósito de dados estruturados, ao passo que os dados não estruturados são considerados data files.

Errado.

O big data suporta tanto dados estruturados como não estruturados. Dados estruturados são os dados em banco de dados tradicionais.

(FCC/Auditor Fiscal da Receita Estadual (SEF SC)/Tecnologia da Informação/2018 )

No âmbito da ciência de dados na definição de Big Data, utilizam-se características ou atributos que alguns pesquisadores adotam como sendo os cinco Vs. Porém, a base necessária para o reconhecimento de Big Data é formada por três propriedades:

a) valor, velocidade e volume.
b) valor, veracidade e volume.
c) variedade, velocidade e volume.
d) variedade, valor e volume.
e) velocidade, veracidade e volume.

Letra C

Nesse questão temos que escolher a melhor resposta. Ele pediu a base. Esse base está nos três primeiros V’s eram Volume, Velocidade e Variedade. Por isso, o gabarito é letra C. Contudo, em uma visão mais moderna. Temos 5V’s. Como vimos, podem ser adicionados a veracidade e o valor.

Siga-me no Instragram

 

 

Avatar


13 de agosto3 min. de leitura