Dados Estruturados vs Dados Não-Estruturados

Avatar


27 de abril4 min. de leitura

Olá pessoALL!


Você que está estudando para concursos da área Fiscal e Controle, como ISSs, SEFAZs e TCs, deve ter percebido o acréscimo de assuntos voltados para Análise Dados e Informações, algo intimamente ligado aos conceitos e conteúdo de Banco de Dados, além do mais, sendo cobrados como Conhecimentos Básicos para esses órgão e seus concursos, tanto FCC como CESPE.

Neste nosso artigo, vou trazer um assunto que sempre cai, seja em uma ou mais questões quando temos no edital o ponto de Análise de Dados e Informações, que é a classificação da estrutura dos Dados.

Dado e Informação

Antes de entrarmos de fato na definição da estrutura dos Dados, você deve saber o que são dados, óbvio. Em resumo, um dado é a representação utilizada para gerar uma informação, outro conceito importante. Os dados sozinhos não correspondem a nenhum significado, não geram nenhuma informação, mas quando analisamos vários dados de forma conjunto, podemos chegar a alguma informação sobre isso.

Imagine que temos uma tabela para representar os funcionários de uma organização, e nela estão incluídos o nome dos funcionários, seus salários, seus setores de trabalho etc., informação necessárias para caracterizar um funcionário dentro de uma organização.

Quando olhamos apenas uma coluna dentro dessa tabela, por exemplo a do salário, temos os dados de R$ 3.500,00 ou R$2.000,00, que sozinhos não nos agregam em nada, mas quando observamos toda a linha da tabela, por exemplo, o funcionário Sergio Sierro recebe R$ 2.000,00 e trabalha no setor de Educação, temos informações a respeito do que está armazenado.

Leva em conta o seguinte: “pessoas trabalham com informações, mas a tecnologia armazena dados”.

Assim você já aprendeu o que é um dado e o que é uma informação, vamos ver agora a estrutura dos dados.

Podemos classificar os dados em três estruturas diferentes: Dados Estruturados, Dados Não-Estruturados e Dados Semiestruturados.

Dados Estruturados

Os dados estruturados são aqueles organizados e representados com uma estrutura rígida, a qual foi previamente planejada para armazená-los, por exemplo um banco de dados, que é a representação mais típica e comum de dados estruturados.

Em um banco de dados, os dados são estruturados conforme a definição de um esquema, que define como as tabelas e suas respectivas linhas e colunas serão armazenadas. Podemos conceituar o esquema de um banco de dados como sendo uma descrição sobre uma organização, ou sobre o minimundo que se deseja representar, definindo quais dados que serão armazenados.

Figura 1

Na Figura 1 temos a representação de uma tabela dentro de um banco de dados, você pode observar que temos uma estrutura bem definida e que sua alteração não é tão simples, por isso dizemos que os dados estruturados são rígidos e não-flexíveis.

Dados Não-Estruturados

Por outro lado, temos os dados não-estruturados, que possuem uma estrutura totalmente inversa dos dados estruturados, sendo flexíveis e dinâmicos ou, até mesmo, sem qualquer estrutura.

Pense em um editar de texto, como o Bloco de Notas ou o Word, vamos adicionando quanto textos queremos, sem qualquer preocupação com campos, restrições ou limites, também podemos adicionar imagens, gráficos e fotos, misturando com os textos que já escrevemos, temos nesse cenário um exemplo de dados não-estruturados.

Você pode lembrar também das redes sociais, onde existe um enorme volume de dados, como textos, imagens e vídeos que são criados diariamente por seus usuários, outro exemplo de dados não-estruturados.

Dados Semiestruturados

Além dos dados estruturados e não-estruturados, existe uma represente que seria a combinação das duas estruturas, os dados semiestruturados, ou seja, não possuem estrutura totalmente rígida nem estrutura totalmente flexível, sendo uma representação heterogênea.

Um exemplo típico seria um arquivo em XML (eXtensible Markup Language, que significa, em português, Linguagem de Marcação Estendida), o qual possui nós, que são rótulas de abertura e fechamento, precedidos de um símbolo “/”, com os dados inseridos entre os nós.

Figura 2

Observe na Figura 2 uma diferença visual para reforçar os conceitos explicados. Os dados estruturados são organizados em um padrão fixo e constante, seguem uma estrutura mais rígida. Os dados não-estruturados, como o próprio nome já diz, não possuem estrutura de organização, sendo totalmente desestruturados. E os dados semiestruturados, estão posicionados entre os extremos, não possuem uma forma rígida, mas também não são totalmente sem qualquer estrutura.

Agora você já aprendeu a diferença entre as estruturas existes para representar os dados, vamos resolver algumas questões.

Direto do Concurso

Questão 1 (CESPE/TCE-SC/Auditor Fiscal de Controle Externo – Informática/2016)

A respeito de dados estruturados, não estruturados e abertos, julgue o item subsequente.

Em se tratando de dados estruturados, a informação de esquema está mesclada aos valores dos dados, e cada objeto de dados pode ter atributos diferentes, que não são conhecidos com antecedência. Essa característica os diferencia de dados não estruturados.

Questão 2 (CESPE/TCE-PB/Auditor de Contas Públicas/2018)
Com relação a dados estruturados e não estruturados, assinale a opção correta.

a) Dados não estruturados podem ser caracterizados por arquivos de diversos tipos — textos, imagens, vídeos, entre outros —, cujas estruturas não são descritas implicitamente.

b) Por padrão, documentos do tipo XML (eXtensible Markup Language) são estruturados.

c) Dados não estruturados de um mesmo grupo possuem as mesmas descrições e, consequentemente, os mesmos atributos.

d) Por padrão, dados não estruturados são organizados em blocos semânticos.

e) A alta heterogeneidade facilita as consultas aos dados não estruturados, desde que estes estejam ligados por ponteiros.

Gabarito Comentado

Questão 1

Resposta Correta: Errado.

Comentário: Como vimos, os dados estruturados possuem uma estrutura rígida, e para poderem ser organizados dentro dessa estrutura é necessário que sejam conhecidos com antecedência para que sejam definidos os grupos, formatos e esquemas. Complementando o nosso assunto, dados estruturados são aqueles que possuem a mesma estrutura de representação rígida e previamente projetada, ou seja, existe um esquema que estabelece algumas características dos dados que serão armazenados, por isso a necessidade de serem conhecidas previamente.

Questão 2

Resposta Correta: Letra a.

Comentário: Analisando cada uma das alternativas. Na letra A, é tratado sobre dados não estruturados, cujas estruturas não são descritas nem explicitamente, nem implicitamente, a estrutura não se conhece, por isso esta alternativa está correta. Na letra B, os documentos XML são considerados semiestruturados. Na letra C, inclui atributos dos dados não estruturados, tendem a possuir uma forma mais livre, não tabular, são dispersos e não facilmente recuperáveis. Na letra D, em um arquivo não-estruturado não existe nenhum bloco semântico que seja facilmente identificado dentro deste arquivo. Na letra E, a heterogeneidade é, principalmente, um dos fatores que dificulta as consultas em dados não estruturados.

Referências

[1] MONTEIRO, Leandro Pinho. Dados Estruturados e Não Estruturados. Universidade da Tecnologia, 2019. Disponível em https://universidadedatecnologia.com.br/dados-estruturados-e-nao-estruturados/

[2] Diferença entre Dados Estruturados e Não Estruturados. Cultura Analítica, 2018. Disponível em https://culturaanalitica.com.br/diferenca-entre-dados-estruturados-e-nao-estruturados/

Avatar


27 de abril4 min. de leitura