Mineração de Dados: Associação

Por
2 min. de leitura

Olá pessoal, vamos de mais um artigo 🙂

No artigo de hoje estarei abordando uma das tarefas utilizadas em Mineração de Dados, quando o objetivo é comparar, estou falando da Associação.

Vem comigo! 😉

Também chamado por alguns autores de “Descoberta de Associações“, o conceito da Associação se aplica aos casos em que um grupo de valores determina outro grupo, ou está associado a outro grupo ou faixa de valores, ou seja, quando A->B (A determina B), onde A e B são conjuntos de valores.

Um dos principais fatores que motivam o uso das regras de associação, são em casos em que as organizações desejam alavancar mais vendas em um determinado segmento comercial, oferecendo produtos que geralmente são consumidos, quando outros produtos são também são consumidos ou consultados. Para isso, são feitas consultas em grandes bases de dados históricas de vendas.

Alguns exemplos práticos:

  • …quanto maior o tempo de espera pelo preparo de um prato, maior o consumo de bebidas..
  • ..se o filé à parmegiana é servido, então o arroz branco e batas fritas também são servidos.. (isso dará uma noção de estoque, a ser mantido, dos produtos associados)
  • ..homens que consultam sapados na internet, geralmente consultam cintos…

Mineração de Dados: Associação

Vejamos baixo, para ilustrar,  uma amostra de 10 transações feitas em um supermercado, onde é possível ver uma associação entre os itens Café, Pão e Manteiga.

Mineração de Dados: Associação

Em todos as transações que ocorreram a compra de café, o pão e a manteiga estiveram também presentes. Esta informação pode servir de insumo para que o gerente do supermercado possa dispor nas prateleiras estes produtos de tal forma que o cliente sinta-se atraído em fazer uma compra conjunta.

Nas análises de associação alguns conceitos são importantes de serem considerados para fins de garantir se os resultados são válidos, são eles:

Segundo Elmasri e Navathe:

Em geral, qualquer regra de associação tem a forma LHS (lado esquerdo ou left-hand side) => RHS (lado direito ou right-hand side), onde LHS e RHS são conjuntos de itens. O conjunto LHS U RHS é o chamado itemset, o conjunto dos itens comprados pelos clientes.

O suporte para uma regra HS => RHS é com relação ao itemset; ele se refere à frequência com que um itemset específico ocorre no banco de dados. Ou seja, o suporte é o percentual de transações que contêm todos os itens no itemset LHS U RHS.

A confiança é com relação à implicação mostrada na regra. A confiança da regra LHS => RHS é calculada como o suporte(LHS U RHS)/suporte(LHS). Podemos pensar nela como a probabilidade de que os itens no RHS sejam comprados, dado que os itens no LSH são comprados por um cliente.

  • Suporte: A medida do suporte indica o percentual de registros (ou frequência de registros), dentro de todo o conjunto de dados, que se encaixam na regra estabelecida;
  • Confiança: Mede o percentual de registros que atendem especificamente a regra (por exemplo, se todos que compram café, compram também pão e manteiga).

Para que uma regra seja considerada forte, é preciso que ela atinja um certo grau mínimo de suporte e confiança estabelecidos.

Agora, vejamos como este assunto já foi cobrado em questões de concursos, vem comigo! 😉

[CEBRASPE/CESPE/SERPRO/ANALISTA-SUPORTE TÉCNICO]

Julgue os itens que se seguem, acerca de data mining e data warehouse.

A data mining apoia a descoberta de regras e padrões em grandes quantidades de dados. Em data mining, um possível foco é a descoberta de regras de associação. Para que uma associação seja de interesse, é necessário avaliar o seu suporte, que se refere à frequência com a qual a regra ocorre no banco de dados.

Gabarito: Certo

[CEBRASPE/CESPE/FUB/TÉCNICO DE TI]

Julgue o item a seguir, a respeito de data mining e OLAP.

No data mining, uma regra de associação relaciona a presença de um conjunto de itens com outra faixa de valores de um outro conjunto de variáveis.

Gabarito: Certo

É isso, vou ficando por aqui 😉

Até o próximo artigo e ótimos estudos.

===============================

Prof. Luis Octavio Lima

Por
2 min. de leitura