A viscosidade no Big Data

Por
2 min. de leitura

Olá Meu querido(a) aluno(a),

Hoje vamos falar sobre big data. Sobre uma novidade cobrada recentemente em concurso. Quando falamos em big data, temos que pensar em dois aspectos:

  • Dados
  • Tecnologia

 

Quando pensamos em tecnologia, devemos nos direcionar para as ferramentas que são capazes de implementar soluções para o tratamento de dados com característica de big data. Por exemplo, o hadoop e firehose. Também entrariam nessa esteira o mapreduce.

Já quando pensamos no aspecto do dado, temos que ter em mente as características do dado. Essas características são chamados de V’s.

Os três V’s originais são:

  • Velocidade
  • Volume
  • Variedade

 

A velocidade está relacionada com o fato dos dados em big data ocorrem em fluxo contínuo. É o que acontece com as postagens nas redes sociais.

O volume, como nome sugere, está relacionado com a quantidade de espaço que é necessário para armazenar dados de big data. Geralmente, esses dados não irão caber, por exemplo, no seu computador de casa.

Por fim, a variedade, está ligada ao fato dos dados possuírem diferentes naturezas. O big data não tem preconceito. Todo tipo dado é bem vindo. Seja ele estruturado ou não estruturado.

Além desse V’s tradicionais, temos outros dois:

  • Valor
  • Veracidade

 

O valor tem relação com o que o big data entrega para organização. Ou seja, o é retorno relacionado ao investimento na tecnologia de big data. Afinal, as organizações tem uma missão estratégia. E o big data surge para agregar valor e a ajudar na consecução desse objetivos.

A veracidade ganha importância no big data principalmente em cenário de fake News. Os gestores irão tomar decisões com base no resultado apresentado pelo sistema de BI. Assim, eles devem confiar nas informações. Ou seja, eles devem ser verdadeiras.

Esse 5V’s já eram conhecidos e cobrados de forma repetida em prova. A grande novidade é um V chamado de viscosidade.

A viscosidade tem relação com a dificuldade de navegar entre os dados. Essa dificuldade pode ser considerar como uma espécie de inércia. Como os dados são variados, o algoritmo tem que ser capaz de lidar com diferentes fontes, essa flexibilidade tem um custo. Um deles é a viscosidade.

(FCC – Ana Leg/ALAP/2020) Atualmente, diversos dados são coletados pelos sistemas digitais de empresas na internet para constituir Big Data com conteúdo sobre os resultados alcançados por seus produtos e serviços, prestígio da imagem da organização e seus representantes. Porém, parte desses dados pode ser falsa ou manipulada por internautas. O tratamento dos dados, a fim de qualificá-los antes de disponibilizá-los para a tomada de decisão na empresa, segundo o conceito das cinco dimensões “V” de avaliação de um Big Data, se refere

a) ao valor.

b) à variedade.

c) à veracidade.

d) à velocidade.

e) ao volume

Questão recente ainda cobrando os 5V’s clássicos.

Note que a questão falou na questão dos dados serem manipulados ou falsos. Ora, isso está relacionado com o V da veracidade. Por tanto, gabarito C.

(Instituto AOCP – Ana (MJSP)/MJSP/Big Data/Governança de Dados/2020) José está enfrentando problemas relacionados ao armazenamento em vários formatos, com estrutura de dados geralmente inconsistente, e à dificuldade de integração. Esses problemas, conhecidos em Qualidade de Dados para Big Data, podem ser respectivamente classificados como

a) Variabilidade e Viscosidade.

b) Volatilidade e Variedade.

c) Veracidade e Variedade.

d) Volume e Volatilidade.

e) Velocidade e Variabilidade

Questão também recente. Note que ao falar em vários formatos estamos falando da variabilidade ou variedade. E ao falar em dificuldade de integração (ou seja, ter os dados juntos) estamos falando da viscosidade. Essa falta de integração dos dados leva a dificuldade de navegação. Portanto, letra A.

Por
2 min. de leitura