Análise de Dados para a Câmara (CEBRASPE): O que realmente cai e como acertar na prova – PARTE I

Por
Publicado em
2 min. de leitura

A Análise de Dados, no contexto do serviço público, vai muito além de “mexer em planilha” ou “fazer gráfico”. Na prática, ela serve para transformar registros de sistemas, planilhas, bases abertas e logs em informação útil para apoiar decisões, monitorar resultados, dar transparência e melhorar processos.

Em provas no estilo CEBRASPE, o tema aparece com um olhar bem completo: conceitos, tipos de dados, etapas do processo (pré-processamento e exploração), noções de ETL/ELT, mineração de dados e visualização com foco na interpretação correta. O que decide a questão, quase sempre, é identificar o objetivo da análise e a técnica adequada.

O que é análise de dados (e o que não é)

Análise de dados é o conjunto de técnicas para explorar, descrever e explicar fenômenos a partir de dados, buscando padrões, tendências, exceções e relações. Ela também pode apoiar previsões, mas isso depende de contexto, qualidade e método — não é “mágica” nem sinônimo automático de IA.

Um erro comum é confundir análise de dados com BI. BI geralmente está mais associado a relatórios, indicadores e dashboards já definidos. A análise de dados inclui também exploração (EDA), preparo dos dados, validação de hipóteses e, quando fizer sentido, modelagem.

Quatro finalidades que a banca adora misturar

A CEBRASPE gosta de afirmar que uma finalidade é outra. Por isso, memorize pelo tipo de pergunta respondida:

  • Descritiva: o que aconteceu?
  • Diagnóstica: por que aconteceu?
  • Preditiva: o que pode acontecer?
  • Prescritiva: o que fazer agora?

Se a assertiva trocar “explicar causas” por “descrever resultados”, desconfie: normalmente é pegadinha.

Tipos de dados: estruturado, semiestruturado e não estruturado

Esse trio cai com frequência e costuma vir com exemplos.

  • Estruturados: tabelas com esquema fixo (linhas/colunas), muito comuns em bancos relacionais e SQL.
  • Semiestruturados: têm organização parcial (chaves/marcação), como JSON, XML e muitos logs.
  • Não estruturados: não nascem em formato tabular, como texto livre, imagens, áudio e vídeo.

A pegadinha clássica é achar que, por estar “dentro de um sistema”, o dado virou estruturado. O armazenamento não muda a natureza do dado: um texto continua não estruturado; um JSON continua semiestruturado.

O que mais “derruba” candidato: dados ruins e interpretação apressada

Em análise de dados, resultado errado costuma vir de dados mal preparados e leitura apressada. Duplicidade, campo em branco, categoria escrita de vários jeitos, datas fora do padrão e inconsistências entre fontes geram conclusões falsas e gráficos enganosos.

Na prova, isso aparece em itens que cobram “correta preparação” e “consistência” antes de qualquer inferência. Sempre que a questão citar qualidade, pense em limpeza, padronização e integração.


Para a prova (CEBRASPE): 3 verdades que você precisa levar

  1. Finalidade da análise é o primeiro filtro (descrever, explicar, prever, prescrever).
  2. Tipo de dado importa (estruturado, semiestruturado, não estruturado).
  3. Armazenar não muda o tipo do dado; modelar/estruturar é outra história.

Questões (estilo CEBRASPE – Certo/Errado)

  1. ( ) A análise diagnóstica busca explicar as causas e fatores associados ao fenômeno observado, indo além de relatar o que ocorreu.
  2. ( ) Dados semiestruturados dependem necessariamente de esquema fixo de tabelas relacionais para serem analisados.
  3. ( ) O fato de um texto estar armazenado em um sistema corporativo não o transforma automaticamente em dado estruturado.

Gabarito: 1 C | 2 E | 3 C

No próximo artigo (Parte 2), eu vou completar o assunto com o que mais aparece nas assertivas do CEBRASPE: pré-processamento e EDA, diferenças práticas entre ETL e ELT, noções essenciais de mineração de dados (classificação, associação e clusterização) e visualização (como escolher o gráfico certo e evitar pegadinhas).

Por
Publicado em
2 min. de leitura