Faaaaaala seus lindos!!! Tudo bem com vocês?
Hoje vamos comentar uma discursivas muito interessante, e que foge um pouco do nosso rol de temas. Essa discursiva tão, mais tão boa de trabalhar foi aplicada no concurso da Secretaria da Fazenda do Estado de Sergipe (SEFAZ/SE – 2025), e trouxe um tema cada vez mais presente nas provas de Tecnologia da Informação e Análise de Dados: a modelagem preditiva como ferramenta estratégica para previsão de eventos e tomada de decisão. A questão pediu que o candidato explicasse quatro etapas do desenvolvimento de um modelo preditivo e apresentasse dois algoritmos ou técnicas utilizados, destacando suas características e contextos de aplicação.
Vamos ver o enunciado completo:
A modelagem preditiva, uma das vertentes mais estratégicas da análise de dados, permite antecipar tendências, identificar riscos e apoiar decisões com base em projeções confiáveis. Por meio de algoritmos estatísticos e de aprendizado de máquina, é possível transformar dados históricos em informações valiosas sobre o futuro. No entanto, a eficácia desse processo depende diretamente da qualidade dos dados, da escolha das variáveis e da correta validação dos modelos construídos.
Considerando as informações apresentadas como unicamente motivadoras, redija um texto dissertativo acerca da modelagem preditiva como ferramenta estratégica para previsão de eventos e tomada de decisão. Ao elaborar seu texto, atenda ao que se pede a seguir.
- Explique quatro etapas do desenvolvimento de um modelo preditivo. [valor: 14,25 pontos]
- Apresente dois algoritmos ou técnicas utilizados em modelagem preditiva, destacando suas características e contextos de aplicação. [valor: 14,25 pontos]
Aqui é importante entender que a banca do Cebraspe não estava falando de “abordagens de desenvolvimento de sistemas – Preditivo ou Adaptativo, mas sim de etapas de aprendizado de máquina — o famoso machine learning pipeline, que transforma dados brutos em previsões com valor estratégico.
Então, para desenvolver sobre o item 1, precisamos entender o que é uma modelagem preditiva em aprendizado de máquina!
A modelagem preditiva é uma aplicação direta do aprendizado supervisionado, uma vertente do machine learning que busca aprender padrões a partir de dados rotulados para prever resultados futuros.
Vocês já aprenderam com o nosso professor Vitor Kessler a diferença entre Aprendizado Supervisionado e Aprendizado Não Supervisionado, não é mesmo?
Assim, a modelagem preditiva é amplamente usada em contextos como previsão de arrecadação, identificação de fraudes tributárias, análise de comportamento de contribuintes e gestão de risco fiscal, permitindo à SEFAZ tomar decisões orientadas por evidências (data-driven).
O poder da modelagem preditiva vem da capacidade dos algoritmos de aprender a partir de exemplos passados — ajustando parâmetros internos até que consigam generalizar o comportamento e prever eventos com alta precisão.
E quais são as etapas do ciclo de aprendizado de máquina preditivo?
O ciclo de aprendizado de máquina envolve etapas iterativas que se retroalimentam. Quem dominou essas fases certamente garantiu nota máxima. E a banca apenas exigiu 4 etapas. Molezinha hein! Vamos então explicar as etapas do ciclo de aprendizagem preditivo.
- Coleta e compreensão dos dados
Nesta fase inicial, identificam-se e reúnem-se dados relevantes ao problema — por exemplo, séries históricas de arrecadação ou perfis de contribuintes.
O analista avalia a qualidade, completude e relevância dos dados, garantindo que representem bem o fenômeno a ser previsto.
- Preparação dos dados
É a limpeza e o tratamento das informações. Inclui remoção de valores ausentes, normalização, padronização de formatos e transformação de variáveis. Essa etapa é crucial porque dados inconsistentes ou enviesados comprometem o aprendizado do modelo — é o famoso “garbage in, garbage out”.
- Seleção de variáveis (feature selection)
Aqui o cientista de dados identifica quais variáveis (ou features) mais influenciam o resultado. O objetivo é reduzir dimensionalidade e eliminar ruídos, garantindo modelos mais simples, explicáveis e eficientes.
- Escolha do algoritmo
Nesta etapa define-se qual técnica de modelagem será utilizada, considerando o tipo de dado (numérico, categórico, textual) e o objetivo da previsão (classificação, regressão etc.).
É o momento de decidir se o problema será tratado com regressão logística, árvore de decisão, redes neurais, SVM, Random Forest, entre outros.
- Treinamento do modelo
O algoritmo é alimentado com uma parte do conjunto de dados (dataset de treino), ajustando seus parâmetros internos para aprender os padrões subjacentes.
O objetivo é minimizar o erro de previsão e garantir que o modelo consiga generalizar o comportamento observado nos dados.
- Validação e teste do modelo
O modelo é testado com dados que ele ainda não viu (dataset de teste), avaliando seu desempenho com métricas como acurácia, precisão, recall, F1-score ou erro médio absoluto (MAE).
Essa etapa revela se o modelo está sofrendo de overfitting (aprendendo demais o treino) ou underfitting (aprendendo de menos).
- Implantação e monitoramento
Após validado, o modelo é implantado em ambiente de produção, passando a gerar previsões reais. O monitoramento contínuo é essencial, pois os dados mudam com o tempo (data drift), exigindo reavaliação e readequação periódica.
Essas sete etapas compõem o pipeline completo de aprendizado preditivo, conectando estatística, ciência de dados e gestão pública orientada por resultados.
Na parte 2 vamos fazer o item 2, que solicitou do candidato o conhecimento sobre algoritmos ou técnicas utilizados em modelagem preditiva, destacando suas características e contextos de aplicação.
Não se esqueça que nos concursos da área fiscal e controle, além desse tema emergente, governança e gestão de tic são temas cobrados com muito peso, e para isso, temos aulas completíssimas, com muitos exercícios, na nossa plataforma!
Bora continuar estudando, porque esse tema ainda vai aparecer muito nas discursivas de concursos. E se a prova gosta, a gente ama!!!
Um grande abraço!!
Professor Darlan Venturelli
@professordarlanventurelli
![[BLACK FRIDAY 2025] Ilimitada Dupla Prorrogado – Cabeçalho](https://blog-static.infra.grancursosonline.com.br/wp-content/uploads/2025/11/27151344/bf25-ai-dupla-prorrogado-cabecalho.webp)
![[BLACK FRIDAY 2025] Ilimitada Dupla Prorrogado – Post](https://blog-static.infra.grancursosonline.com.br/wp-content/uploads/2025/11/27151935/bf25-ai-dupla-prorrogado-post.webp)