A granularidade dos dados é um conceito essencial em Business Intelligence (BI), pois determina o nível de detalhe das informações armazenadas. Quanto maior a granularidade, mais agregados são os dados, representando um panorama mais amplo e menos detalhado, enquanto uma granularidade menor significa informações mais específicas e detalhadas. Essa escolha impacta diretamente na capacidade de análise e tomada de decisão.
Ao analisar vendas em um varejo, por exemplo, os dados podem ser armazenados em diferentes níveis de granularidade. Uma granularidade alta poderia mostrar apenas o total de vendas por região e mês, enquanto uma granularidade média detalharia por semana e loja, e uma granularidade baixa incluiria cada transação com data, hora, cliente e produtos comprados.
Os sistemas de BI utilizam ferramentas de processamento analítico online (OLAP) para manipular a granularidade dos dados e extrair informações útis. Entre as principais operações OLAP estão o roll-up, drill-down, slice, dice e pivot, cada uma com um propósito específico para permitir diferentes perspectivas da análise.
O roll-up é uma operação que reduz a granularidade ao agregar dados em um nível superior. Isso ocorre, por exemplo, ao somar as vendas diárias para obter um total mensal. Dessa forma, é possível obter uma visão mais resumida sem analisar detalhes específicos.
O drill-down, por outro lado, permite o detalhamento dos dados ao reduzir o nível de agregação. A partir de um total mensal de vendas, por exemplo, é possível desmembrar os valores por semana e depois por dia, permitindo uma análise mais aprofundada.
Outra operação importante é o slice, que extrai um subconjunto dos dados para análise específica. Um exemplo disso seria visualizar apenas as vendas de uma determinada região durante um período específico, ajudando a identificar tendências regionais.
O dice funciona de forma semelhante ao slice, mas permite a aplicação de múltiplos filtros para obter uma visão mais segmentada dos dados. Isso pode ser útil, por exemplo, para verificar as vendas de um produto específico em lojas determinadas durante um intervalo de tempo definido.
A operação de pivot é outra funcionalidade essencial do OLAP, pois permite alterar a perspectiva da análise ao reorganizar as dimensões dos dados. Em vez de visualizar as vendas por região e depois por produto, é possível inverter essa ordem para obter um novo insight.
A granularidade dos dados influencia diretamente o tipo de análise que pode ser realizada dentro de um sistema de BI. Com a utilização adequada das operações OLAP, é possível ajustar esse nível de detalhe conforme a necessidade e explorar os dados sob diferentes perspectivas.
Vamos agora responder algumas questões de concursos anteriores:
Prova: FGV – 2023 – SMPOG de Belo Horizonte – MG – Analista de Planejamento e Gestão Governamental: Ciência da Computação
Assinale a opção que indica a operação OLAP que permite analisar os dados de um Data Warehouse em níveis de agregação progressivamente mais detalhados, ou de menor granularidade.
A) Slide.
B) Pivot.
C) Roll-up.
D) Drill-down.
Gabarito: D
Comentários:
A questão pede a operação OLAP que permite analisar os dados de um Data Warehouse em níveis de agregação progressivamente mais detalhados ou de menor granularidade. Vamos analisar cada alternativa:
Alternativa A – Slide (Incorreta)
A operação slice (possivelmente um erro de digitação, pois “slide” não é uma operação OLAP comum) consiste em fixar um valor para uma dimensão e analisar um subconjunto de dados. Por exemplo, se um Data Warehouse contém informações de vendas por região, mês e produto, um slice pode ser usado para visualizar apenas as vendas de um determinado mês.
Alternativa B – Pivot (Incorreta)
A operação pivot é usada para alterar a disposição das dimensões em um relatório, mudando a forma de visualização dos dados. Um exemplo clássico é trocar a visualização de “vendas por região” para “vendas por produto”.
Alternativa C – Roll-up (Incorreta)
O roll-up agrega os dados, reduzindo o nível de detalhe e tornando-os menos granulares. Por exemplo, se os dados estão organizados por dias, um roll-up pode sumarizá-los por mês ou ano.
Alternativa D – Drill-down (Correta)
O drill-down permite explorar os dados em níveis de agregação progressivamente mais detalhados, reduzindo a granularidade. Por exemplo, ao analisar vendas por ano, podemos aplicar um drill-down para visualizar as vendas por trimestre, depois por mês, depois por dia.
Prova: CESPE / CEBRASPE – 2023 – CNMP – Analista do CNMP – Área: Tecnologia da Informação e Comunicação – Especialidade: Suporte e Infraestrutura
A respeito de data warehouse e data mining, julgue o próximo item.
Em data warehouse, o conceito de granularidade refere-se ao nível de detalhe ou resumo existente em uma unidade de dados, de forma que, quanto mais detalhes, mais alto o nível de granularidade.
Gabarito: E
Comentários:
O conceito de granularidade em Data Warehouse refere-se ao nível de detalhe dos dados armazenados:
- Granularidade baixa: Dados muito detalhados, armazenando informações em seu nível mais específico. Exemplo: registro de cada transação de venda com data, horário, cliente, produto, preço etc.
- Granularidade alta: Dados mais agregados, representando um resumo das informações. Exemplo: total de vendas por mês, por região ou por categoria de produto.
A relação entre granularidade e nível de detalhe é inversa:
- Menos detalhes → Maior granularidade (dados agregados).
- Mais detalhes → Menor granularidade (dados desagregados).
A questão afirma que quanto mais detalhes, mais alto o nível de granularidade, mas o correto é que quanto mais detalhes, menor a granularidade.
Prova: FUNDATEC – 2022 – AGERGS – Técnico Superior Engenheiro de Dados
Sobre granularidade de um modelo dimensional, assinale a alternativa correta.
A) Grão é o menor nível de informação e é definido de acordo com as necessidades do modelo de dados.
B) Grão é o nome dados a uma tabela de um modelo Starschema.
C) Grão é considerado um prefixo de nomenclatura de tabela de banco de dados na construção de um modelo dimensional.
D) Grão é a sumarização dos caracteres de um resultado de uma consulta de select no banco de dados PostgreSQL.
E) O Grão de uma tabela é a soma de todas as colunas de um banco de dados.
Gabarito: A
Comentário
A questão pede a alternativa correta sobre granularidade no contexto de modelagem dimensional. Vamos analisar cada alternativa.
Alternativa A – Grão é o menor nível de informação e é definido de acordo com as necessidades do modelo de dados.
O grão (ou granularidade) em um modelo dimensional refere-se ao nível mais detalhado de informação armazenado em uma tabela fato. Ele define o que cada linha na tabela fato representa e é uma decisão fundamental na modelagem dimensional, pois impacta diretamente o nível de detalhe disponível para análise.
Alternativa B – Grão é o nome dado a uma tabela de um modelo Starschema.
O modelo Star Schema (Esquema Estrela) organiza os dados em tabelas fato e dimensão, mas grão não é o nome de uma tabela. O grão define o nível de detalhe da tabela fato, mas não se refere ao nome da tabela.
Alternativa C – Grão é considerado um prefixo de nomenclatura de tabela de banco de dados na construção de um modelo dimensional.
Não há nenhuma relação entre grão e nomenclatura de tabelas. O grão está relacionado ao nível de detalhe dos dados, e não a convenções de nomenclatura.
Alternativa D – Grão é a sumarização dos caracteres de um resultado de uma consulta de select no banco de dados PostgreSQL.
O grão não tem relação com a contagem ou a sumarização de caracteres em consultas SQL. Ele define o nível de detalhe da tabela fato em um Data Warehouse, e não se relaciona diretamente com operações de SELECT.
Alternativa E – O Grão de uma tabela é a soma de todas as colunas de um banco de dados.
O grão não é uma soma de colunas, mas sim a definição do nível de detalhe da tabela fato. A granularidade afeta a quantidade de registros e a forma como os dados são armazenados, mas não corresponde à soma das colunas de um banco de dados.
Quer ficar por dentro dos concursos públicos abertos e previstos pelo Brasil? Clique nos links abaixo:
Receba gratuitamente no seu celular as principais notícias do mundo dos concursos. Clique no link abaixo e inscreva-se:
Participe da conversa