Mineração de Dados

Data Mining for All !

Por
3 min. de leitura

 

Mineração de Dados

Olá Pessoal!

 

Hoje trataremos de um tema muito cobrado pelas bancas nos concursos para carreiras policiais e de auditoria, que é a Mineração de Dados, ou em inglês Data Mining. Esse tema se tornou corriqueiro devido a evolução da tecnologia da informação e da grande quantidade de possibilidades de análise de informação das mais diversas fontes.

A mineração de dados surgiu como método para análise e descoberta de padrões utilizando técnicas de estatística com a finalidade de descoberta de conhecimento em bases de dados. Sua grande utilização veio com o advento do termo Business Intelligence – B.I ainda nos anos 90 do século passado. Onde podemos conceituar como o processo de coleta, organização, análise, compartilhamento e monitoramento de informações que oferecem suporte a gestão de negócios e tomada de decisão pela alta gestão.

Em resumo B.I pode ser entendido como um universo de métodos, processos, tecnologias que buscam analisar dados e transformar em informação para tomada de decisão.

E dentro desses estudos alguns autores renomados como Ralph Kimball e Bill Inmon versam sobre técnicas de modelagem para datawarehouse e para entender melhor sobre esse tema é interessante analisar a figura abaixo:

 

Na figura então temos que Data Mining pode ser aplicado em cima de Data Warehouse mas não é uma técnica exclusiva dentro dos estudos e teorias de B.I. Data Mining pode ser aplicado em Big Data por exemplo, que são um conjunto de teorias e tecnologias diversas do mundo de B.I, vejamos uma figura para entendermos melhor um processo de Big Data.

Obs: Não conhece o tema Big Data? Procure meu artigo aqui no blog do Gran, lá apresento alguns conceitos básicos.

 

Então para que fique claro podemos definir que o processo de minerar dados para descobrir conexões escondidas e prever tendências futuras tem uma longa história. Sua base compreende três disciplinas científicas entrelaçadas que existem há tempos:  Estatística (o estudo das relações entre dados), Inteligência Artificial – I.A (inteligência exibida por softwares e/ou máquinas, que se assemelha à humana) e Aprendizado de máquina (algoritmos que podem aprender com dados para realizar análise preditiva).

A mineração de dados pode realizar associação de dados, detectar padrões por agrupamento, além de identificar e detectar anomalias tudo isso baseado na análise dos dados e suas correlações.

 

E para entender melhor onde entraria o trabalho de um auditor, veremos a questão a seguir que é bastante didática.

 

Ano: 2019 Banca: FCC Órgão: SEFAZ-BA Prova: FCC – 2019 – SEFAZ-BA – Auditor Fiscal – Administração Tributária – Prova II

Além dos indicadores reativos que, uma vez implantados, automaticamente detectam as ocorrências com base nos indicadores mapeados, existem também os controles proativos, que requerem que os gestores os promovam periodicamente. Uma das técnicas que os gestores podem usar requer que sejam selecionadas, exploradas e modeladas grandes quantidades de dados para revelar padrões, tendências e relações que podem ajudar a identificar casos de fraude e corrupção. Relações ocultas entre pessoas, entidades e eventos são identificadas e as relações suspeitas podem ser encaminhadas para apuração específica. As anomalias apontadas por esse tipo de técnica não necessariamente indicam a ocorrência de fraude e corrupção, mas eventos singulares que merecem avaliação individualizada para a exclusão da possibilidade de fraude e corrupção e, no caso da não exclusão, uma investigação.

(Adaptado de: TCU – Tribunal de Contas da União)

O texto se refere à técnica de

a) data mart.

b) data warehousing.

c) big data.

d) OLAP.

e) data mining.

E mais uma questão do concurso da Polícia Federal.

(CESPE/Polícia Federal/Agente de Polícia Federal/2018)

Julgue o item que segue, relativo a noções de mineração de dados, big data e aprendizado de máquina.

Pode-se definir mineração de dados como o processo de identificar, em dados, padrões válidos, novos, potencialmente úteis e, ao final, compreensíveis.

Certo ou Errado ?

O gabarito pode ser consultado no final desse artigo.

 

Para Pensar !!!

Um dos problemas para os concurseiros nesse tema é a quantidade de conceitos existentes, no Gran Cursos Online temos diversas aulas para explicar quando se deve dar atenção a cada um deles, pois as diversas bancas examinadoras cobram esse assunto de diversas maneiras.

Dessa forma encerro esse artigo com essa breve introdução sobre o assunto! Até mais !

 

GABARITO

  1. LETRA E.
  2. CERTO, definição completa do que é a mineração de dados.

Referências

 

[1] https://www.oficinadanet.com.br/post/13153-o-que-e-business-intelligence

[2] GOLDSCHMIDT, Ronaldo; PASSOS, Emmanuel. Data mining: um guia prático. Gulf Professional Publishing, 2005.

 

Professor MSc, Washington Almeida

 

Doutorando e Mestre em Engenharia de Software pelo Centro de Estudos e Sistemas Avançados do Recife – C.E.S.A.R. Atualmente é Analista Judiciário na Justiça Federal (TRF1) e Professor no Gran Cursos Online.

 

Por
3 min. de leitura