Futuros Auditores do TCU, quando falamos em Engenharia de Dados na prova do CEBRASPE, o ponto central não é a memorização isolada de conceitos, mas a capacidade de compreender como as tecnologias de dados se articulam em ambientes reais da administração pública. A banca costuma trabalhar com afirmações aparentemente corretas, mas que trazem exageros, generalizações ou inversões conceituais sutis — exatamente onde muitos candidatos acabam errando.
Os bancos de dados relacionais, como Oracle e Microsoft SQL Server, continuam sendo a espinha dorsal de sistemas críticos. Eles aparecem associados à integridade dos dados, ao controle transacional e à consistência, especialmente em cenários de concorrência e recuperação após falhas. Para o TCU, é essencial entender que essas características não são apenas teóricas: elas impactam diretamente a confiabilidade das informações utilizadas no controle e na auditoria governamental.
Ao lado disso, os bancos de dados NoSQL, como MongoDB e Elasticsearch, surgem como resposta a demandas por escalabilidade, desempenho e flexibilidade de esquema. No entanto, o CEBRASPE costuma penalizar afirmações absolutas sobre esses bancos. Bancos orientados a documentos não dependem exclusivamente de tabelas hash distribuídas nem se limitam a buscas simples por chave. A banca explora justamente essas simplificações para induzir o erro.

Figura 1 – Comparação de Bancos de Dados
A modelagem de dados é outro eixo fundamental. O modelo relacional prioriza normalização e integridade, enquanto o modelo multidimensional é voltado à análise, com fatos e dimensões organizados, em geral, no esquema estrela. Nesse ponto, o examinador costuma testar a compreensão correta do papel das chaves, principalmente em tabelas fato e dimensão, explorando inversões conceituais comuns entre candidatos menos atentos.
As arquiteturas analíticas modernas também ganham destaque. Data Warehouse, Data Mart, Data Lake e Data Mesh não são tratados como sinônimos, mas como soluções distintas para problemas diferentes. Em especial, o Data Lake aparece associado ao armazenamento de dados em estado bruto, estruturados, semiestruturados e não estruturados, adotando o paradigma de schema-on-read. Confundir essas arquiteturas é um erro recorrente e frequentemente explorado em prova.

Figura 2 – Evolução das Arquiteturas
O fluxo de manipulação de dados, por meio de processos de ETL e pipelines, é abordado de forma integrada. O TCU espera que o candidato compreenda desde a extração até o consumo dos dados, incluindo aspectos como paralelismo, versionamento, logging, auditoria, tolerância a falhas, retries e checkpoints. Esses elementos são tratados como requisitos de confiabilidade e rastreabilidade, e não como detalhes técnicos periféricos.
A integração de dados aparece como um tema transversal, envolvendo APIs REST e SOAP, web services e arquivos em formatos como CSV, JSON, XML e Parquet. A banca costuma explorar a classificação correta desses formatos, especialmente a distinção entre dados estruturados, semiestruturados e não estruturados, punindo respostas que simplificam excessivamente esse ponto.
Por fim, a governança e a qualidade de dados ocupam espaço crescente nas provas. Conceitos como linhagem, catalogação, metadados, glossários e políticas de acesso são cobrados como práticas de gestão do ciclo de vida dos dados. O CEBRASPE deixa claro que governança de dados não se confunde com governança corporativa ou com métricas de desempenho institucional, e essa separação conceitual é decisiva para o acerto das questões.
Em resumo, a Engenharia de Dados cobrada pelo TCU exige visão sistêmica e atenção às sutilezas conceituais. Mais do que saber o “nome das coisas”, o candidato precisa compreender o papel de cada tecnologia dentro da arquitetura de dados e identificar afirmações absolutas ou imprecisas, que são exatamente o tipo de armadilha preferida pela banca.
👉 Na Parte II deste artigo, serão apresentadas questões reais do TCU/CEBRASPE, com identificação de banca e concurso, além de comentários direcionados para a forma como o examinador constrói seus itens e induz ao erro.
![[REINVENÇÃO 2026] Lote relâmpago – Cabeçalho](https://blog-static.infra.grancursosonline.com.br/wp-content/uploads/2025/12/31124357/1238X216-1.webp)
![[REINVENÇÃO 2026] Lote relâmpago – Post](https://blog-static.infra.grancursosonline.com.br/wp-content/uploads/2025/12/31124859/730X150-1-1.webp)