Olá, salve, salveee! 🙂
Vamos de mais um artigo pessoal!
Desta vez trago alguns conceitos básicos sobre Data Warehouse (DW), assunto muito cobrado em vários editais para concursos públicos. Vem comigo!
Atualmente um dos elementos mais valiosos no mundo é a informação. A informação, que tem por base conjuntos de dados em vários contexto, tem sido alvo de busca pela organizações para fins de tomada de decisão e formulação de estratégias. A cada instante, no mundo, milhares de dados circulam por sistemas, mídias sociais, formulários eletrônicos, dentre outros.
O grande desafio é coletar, transformar e armazenar estes dados em um local onde seja possível realizar diversas consultas, cruzamentos de dados e assim obter informação preciosas para tomada de decisão. É neste contexto que o Data Warehouse chega para dar apoio. Vejamos abaixo algumas citações de autores conhecidos.
Segundo Inmon:
“Data warehouse é uma coleção de dados orientada por assuntos, integrada, não volátil e variável em relação ao tempo, que tem por objetivo dar suporte aos processos de tomada de decisão”.
Segundo Kimball:
“Data warehouse é todo processo que provê informação para o suporte à tomada de decisão”.
Segundo Laudon & Laudon:
“Data warehouse é um banco de dados que armazena dados correntes e históricos de potencial interesse para os tomadores de decisão de toda a empresa. Os dados originam-se de muitos sistemas operacionais centrais, como sistemas de vendas, contas de clientes e manufatura, podendo incluir ainda dados advindos de transações em sites. O data warehouse consolida e padroniza as informações oriundas de diferentes bancos de dados operacionais, de modo que elas possam ser usadas por toda empresa para análise gerencial e tomada de decisões.”
Deu para perceber o quão importante é o DW para obtenção de dados e construção da informação necessária para tomada de decisão.
Vamos esclarecer alguns conceitos que fazem parte do contexto do DW:
Orientado a Assunto: O DW armazena informações do assunto específico e importante para o negócio da empresa ou organização, seja pública ou privada. Por exemplo: dados sobre o assunto compras do governo, pagamentos feitos pelo governo, proventos e benefícios recebidos pelos servidores públicos, processos judiciais de um tribunal, e assim por diante.
Integrado: Este conceito integrado não é de “integração de sistemas”, a banca adora dar um “nó” na cabeça do candidato(a). Estamos falando de um dado integrado, ou seja, um dado que não tenha variação de significado e representatividade. Por exemplo: dados de datas, caso sejam usadas de forma diferente em diferentes sistemas, ao ser inclusas no DW elas são transformadas para um formato único, sem variâncias, dando mais consistência à informação. Diferentes nomenclaturas, formatos e estruturas das fontes de dados precisam ser acomodadas em um único esquema para prover uma visão unificada e consistente da informação.
Não volátil: Significa que o DW permite inicialmente a inserção dos dados e posterior consulta, não sendo possível transacionar dados ou alterar os dados já carregados, diferente dos sistemas transacionais ou operacionais. O DW carregará dados em momentos distintos e geralmente por blocos periódicos.
Variante no Tempo: Significa que os dados de um DW possuem uma referência de momento específico, sendo que tal dado não é atualizável. Em vez de mudança num dado já carregado, temos na verdade uma nova carga sendo feita e registrando outro momento como referência, ou seja, uma variante no tempo. Em resumo, para cada dado ou conjunto de dados haverá um campo ou campos do tipo data que servirá de referência temporal. Tal variante serve para guardar o histórico dos dados no DW.
Granularidade: Refere-se ao nível de detalhe das unidades de dados existentes no DW. Quanto maior for o nível de detalhe (mais específico ou analítico) do dado, menor é seu nível de granularidade e maior será o volume de dados armazenados, assim como, quanto menor for o nível de detalhe (menos específico ou sintético) do dado, maior será o seu nível de granularidade. Quando este assunto é cobrado em questões de concursos, é comum ser apresentado o termo “sumarização”, ou seja, a capacidade de sintetizar dados, podendo usar recursos de agrupamento de dados. Quanto mais sumarizado, maior a granularidade, ou seja, menor o detalhamento. Mais à frente, nesta aula, veremos algumas operações de exploração dos dados de um DW e este conceito de granularidade será observado na prática.
Questão de Concurso
(CEBRASPE/CESPE/IPHAN/ANALISTA I-ÁREA 7/2018)
Julgue o item que se segue, a respeito de tecnologias de sistemas de informação.
O data warehouse é integrado, não volátil e orientado a assuntos, contudo, embora lide com dados e os armazene para a tomada de decisões gerenciadas, não é considerado um banco de dados, pois é variável em relação ao tempo.
Comentário:
A questão começou bem, mas terminou mal!
Vamos lá!
O DW recebe dados de várias fontes e é um considerado dimensional ou multidimensional, cuja finalidade é permitir que usuários finais possam coletar dados em várias composições, agregações, sumarizações, para que os auxilie na tomada de decisão. Apesar de tudo isso, ele é também um banco de dados, pois armazena dados de outras fontes, porém em um formato diferente dos demais, no caso, em um formato dimensional. O erro da questão foi afirmar que o DW não é um banco de dados.
Gabarito: Errado.
Bem, vou ficando por aqui, desejo ótimos estudos para todos. Até o próximo artigo, um abração! 😉
==============================
Prof. Luis Octavio Lima
Participe da conversa