Faaaaaala seus lindos!!! Tudo bem com vocês?
Vamos dar continuidade ao estudo da prova discursiva aplicada no concurso da Secretaria da Fazenda do Estado de Sergipe (SEFAZ/SE – 2025) que trouxe um tema importantíssimo de ser estudado, pois está presente nas provas de Tecnologia da Informação e Análise de Dados: a modelagem preditiva como ferramenta estratégica para previsão de eventos e tomada de decisão. A questão pediu que o candidato explicasse quatro etapas do desenvolvimento de um modelo preditivo e
apresentasse dois algoritmos ou técnicas utilizados, destacando suas características e contextos de aplicação. Lembrando que o Item 1 foi comentado no artigo anterior, e nesse artigo, vamos tratar apenas do item 2. Mas, é claro, vamos ver o enunciado completo:
A modelagem preditiva, uma das vertentes mais estratégicas da análise de dados, permite antecipar tendências, identificar riscos e apoiar decisões com base em projeções confiáveis. Por meio de algoritmos estatísticos e de aprendizado de máquina, é possível transformar dados históricos em informações valiosas sobre o futuro. No entanto, a eficácia desse processo depende diretamente da qualidade dos dados, da escolha das variáveis e da correta validação dos modelos construídos.
Considerando as informações apresentadas como unicamente motivadoras, redija um texto dissertativo acerca da modelagem preditiva como ferramenta estratégica para previsão de eventos e tomada de decisão. Ao elaborar seu texto, atenda ao que se pede a seguir.
- Explique quatro etapas do desenvolvimento de um modelo preditivo. [valor: 14,25 pontos]
- Apresente dois algoritmos ou técnicas utilizados em modelagem preditiva, destacando suas características e contextos de aplicação. [valor: 14,25 pontos]
Na parte 1, nós falamos sobre as etapas de uma modelagem preditiva, e abordamos todas as etapas, apesar do enunciado ter nos exigido apenas 4 etapas.
Na parte 2, agora, vamos atender ao item 2, mencionando 2 algoritmos ou técnicas utilizados, destacando as características e contextos de aplicação.
O candidato poderia aqui explorar todos os conhecimentos passados pelo nosso grande mestre Vitor Kessler em suas aulas. Vejamos como poderia ser uma resposta capaz de garantir nota máxima:
Regressão Linear
Técnica estatística que prevê valores contínuos (numéricos) com base em variáveis independentes.
É ideal para estimar, por exemplo, valores de arrecadação, variação de preços, impactos econômicos ou projeções de receitas.
A simplicidade e a interpretabilidade tornam a regressão linear uma excelente escolha para problemas em que a transparência do modelo é essencial.
2. Regressão Logística
Usada para prever eventos binários (ex.: fraude/não fraude, adimplente/inadimplente).
Embora o nome remeta à regressão, trata-se de um modelo de classificação.
É amplamente empregada em riscos fiscais e de crédito, pois oferece coeficientes explicáveis, algo vital em órgãos públicos que precisam justificar decisões.
3. Árvores de Decisão (Decision Trees)
Estruturas hierárquicas que dividem dados em ramos baseados em condições lógicas simples.
São altamente visuais, facilitando a explicabilidade do modelo — um requisito em qualquer política de transparência algorítmica.
Aplicações típicas: detecção de contribuintes com alta probabilidade de evasão fiscal ou segmentação de grupos de risco.
4. Random Forest (Floresta Aleatória)
Combina várias árvores de decisão, reduzindo erros e aumentando a robustez do modelo.
É eficaz em bases volumosas e heterogêneas, típicas do contexto da SEFAZ.
Permite prever, por exemplo, inadimplência tributária, fraudes em notas fiscais e desvios em séries temporais de arrecadação.
5. Redes Neurais Artificiais (RNA)
Inspiradas no funcionamento do cérebro humano, aprendem padrões complexos em grandes volumes de dados.
São indicadas para problemas de alta dimensionalidade ou não linearidade, como detecção de fraudes, análise de comportamento de contribuintes e previsão de séries temporais complexas.
Apesar da alta precisão, exigem maior poder computacional e cuidados com interpretabilidade (black box).
6. Support Vector Machines (SVM)
Técnica de classificação que busca um hiperplano ótimo para separar categorias.
Tem excelente desempenho em conjuntos de dados com muitas variáveis, sendo útil para prever riscos de inadimplência ou padrões anômalos de transações fiscais.
É um dos algoritmos mais estáveis e robustos em bases pequenas ou moderadas.
7. K-Nearest Neighbors (KNN)
Método baseado na proximidade de instâncias. Para prever o comportamento de um contribuinte, por exemplo, o modelo compara com outros contribuintes “parecidos” em histórico e perfil. É simples, mas poderoso quando bem calibrado, e muito usado em sistemas de recomendação e classificação tributária.
8. Naive Bayes
O meu amigo Vitor Kessler pronuncia esse nome direitinho!! Aconselho procurar as aulas desse meu grande amigo e grande mestre!! Baseado no teorema de Bayes, utiliza probabilidades condicionais para prever classes. É eficiente em textos e classificações rápidas, podendo ser usado, por exemplo, em análise automatizada de autos de infração ou classificação de e-mails fiscais.
9. Técnicas de Ensemble (Híbridos)
Modelos combinados, como Gradient Boosting, XGBoost e LightGBM, integram o resultado de diversos algoritmos para otimizar precisão. São amplamente usados em competições de ciência de dados (Kaggle) e em projetos de IA governamental, onde precisão e estabilidade são essenciais.
Embora a banca tenha indicado regressão linear, árvores de decisão e redes neurais como exemplos suficientes, como oportunidade de estudo, trouxemos mais algumas possibilidades para estudarmos o tema, contextualizando assim, diferentes técnicas e reconhecendo seus trade-offs — como interpretabilidade, custo computacional e aplicabilidade.
Na parte 1 estudamos as etapas do desenvolvimento de um modelo preditivo, e aqui concluímos as técnicas que podem ser utilizadas. Assim terminamos essa excelente questão que nos ensina modelagem de dados e nos ajuda a estudar algoritmos e técnicas para lidar com dados em modelagem preditiva.
Não se esqueça que nos concursos da área fiscal e controle, além desse tema emergente, governança e gestão de tic são temas cobrados com muito peso, além de contratações de TIC, Planejamento Estratégico e Gestão Ágil. Portanto, não deixe de procurar nossas aulas, que estão completíssimas, com muitos exercícios!
Bora continuar estudando todos os temas que a prova gosta… pois, se a prova gosta, a gente ama!!!
Um grande abraço!!
Professor Darlan Venturelli
@professordarlanventurelli
![[BF 2025] Lote do mês – Cabeçalho](https://blog-static.infra.grancursosonline.com.br/wp-content/uploads/2025/10/23172755/CABECALHO-1238X216.webp)
![[BF 2025] Lote de mês – Post](https://blog-static.infra.grancursosonline.com.br/wp-content/uploads/2025/10/23173301/POST-730X150.webp)



Participe da conversa