Big Data é um dos temas mais populares em provas de concursos da área de TI, especialmente para cargos como analista de sistemas, cientista de dados e suporte à gestão da informação.
O termo “Big Data” refere-se a conjuntos de dados tão grandes e complexos que ferramentas tradicionais de processamento de dados não conseguem tratá-los eficientemente.
Inicialmente, o conceito de Big Data era descrito pelos 3 Vs: Volume, Velocidade e Variedade. Hoje, é comum encontrar abordagens que ampliam esse conceito para 5, 6 ou 7 Vs.
O primeiro V é o Volume, que trata da quantidade massiva de dados gerados continuamente por redes sociais, sensores, transações financeiras, entre outras fontes.
O segundo V é a Velocidade, relacionada à rapidez com que os dados são gerados, transmitidos e processados. Em sistemas modernos, é necessário lidar com dados em tempo real.
O terceiro V é a Variedade, indicando a diversidade de formatos de dados: estruturados (bancos relacionais), semi-estruturados (JSON, XML) e não estruturados (vídeos, áudios, imagens).
Com o avanço dos sistemas, surgiram mais dois Vs. O quarto V é a Veracidade, que trata da confiabilidade e qualidade dos dados capturados, fundamental para análises fidedignas.
O quinto V é o Valor, que diz respeito à capacidade de extrair conhecimento útil dos dados. De nada adianta coletar uma quantidade enorme de dados se não houver informação relevante a ser obtida.
Algumas abordagens acrescentam ainda mais Vs. O sexto V é a Variabilidade, que considera as mudanças de significado dos dados ao longo do tempo ou conforme o contexto.
Por fim, um sétimo V é a Visualização, essencial para tornar inteligíveis os resultados de análises em grandes volumes de dados.
As bancas exploram essas características em diversas formas: perguntam o significado de cada V, pedem para relacionar cenários a cada conceito, ou avaliam a capacidade de identificar exemplos práticos.
É comum, por exemplo, encontrar questões que confundem Volume e Velocidade ou que testam o entendimento de que dados de redes sociais possuem alta Variedade e Velocidade, mas baixa Veracidade.
Portanto, é fundamental conhecer cada V de maneira conceitual e também através de exemplos do mundo real, pois é assim que as questões costumam ser formuladas.
Para consolidar seu entendimento, vamos resolver duas questões inéditas criadas com base no estilo cobrado em concursos recentes:
Questão 1 – Sobre o conceito de Big Data, assinale a alternativa correta:
A) O V de Velocidade refere-se à diversificação de formatos dos dados.
B) O V de Volume refere-se à taxa com que dados se tornam obsoletos.
C) O V de Veracidade está relacionado à confiabilidade dos dados coletados.
D) O V de Valor representa a quantidade de fontes de onde os dados foram obtidos.
E) O V de Variabilidade trata do armazenamento físico de grandes volumes de dados.
Gabarito: C
Comentários:
- A: Errada. Diversidade de formatos é Variedade.
- B: Errada. Obsolescência dos dados está ligada à Variabilidade, não Volume.
- C: Correta. Veracidade é a confiança nos dados.
- D: Errada. Valor refere-se à capacidade de extrair informações úteis.
- E: Errada. Armazenamento em si está mais ligado ao Volume.
Questão 2 – Considere as afirmativas a respeito dos Vs do Big Data:
I. O V de Volume trata da quantidade massiva de dados gerados.
II. O V de Valor refere-se à velocidade com que os dados são processados.
III. O V de Velocidade refere-se à rapidez na geração e transmissão dos dados.
Estão corretas:
A) Apenas I
B) Apenas II
C) Apenas III
D) I e III
E) II e III
Gabarito: D
Comentários:
- I: Correta. Volume é a quantidade de dados.
- II: Errada. Valor não é relacionado à velocidade.
- III: Correta. Velocidade é a rapidez na geração e transmissão dos dados.
Quer ficar por dentro dos concursos públicos abertos e previstos pelo Brasil? Clique nos links abaixo:
Receba gratuitamente no seu celular as principais notícias do mundo dos concursos. Clique no link abaixo e inscreva-se:
Participe da conversa