Data Mining: é possível transformar fraldas e cerveja em uma mina de ouro?

Autor convidado: Elcio Santos, AlwaysOn

Você certamente conhece a história. Uma grande rede de mercados norte-americana, ao analisar as transações de compras, teria descoberto que um número razoável de compradores de fraldas também comprava cerveja na véspera de finais de semana.

A análise também apontou que esses compradores eram homens que, ao comprarem fraldas para seus filhos, compravam também cerveja para consumo enquanto cuidavam das crianças e assistiam aos jogos na televisão durante o final de semana.

A empresa teria utilizado esse novo conhecimento (data analytics) para colocar lado a lado as gôndolas de fraldas e cervejas na rede de mercados, incrementando assim a venda conjunta dos dois produtos.

Infelizmente, ninguém pode realmente atestar a veracidade da história.

Ora fala-se que as fraldas eram da marca Pampers, ora fala-se em Johnson & Johnson. Alguns citam a Target como a empresa que fez as análises, outros falam no Walmart (caso alguém tenha alguma informação que possa desanuviar o assunto, dividida conosco).

Talvez tenha sido um experimento mental – que nem o Gato de Schrödinger – que fazia sentido.

Tanto que entrou para o folclore da administração.

E faz sentido mesmo, pois ilustra uma das grandes vantagens do Data Mining

O que é Data Mining

A expressão significa mineração de dados em português.

É o processo de descobrir informações acionáveis em grandes conjuntos de dados.

A atividade de Data Mining usa análise matemática para derivar padrões e tendências que existem nos dados.

Normalmente, esses padrões não podem ser descobertos pela exploração de dados tradicionais porque os relacionamentos são muito complexos ou porque há muitos dados.

Esses padrões e tendências podem ser coletados e definidos como um modelo de mineração de dados.

Os modelos de Data Mining podem ser aplicados a cenários específicos.

Por exemplo:

  • Previsões — estimativas de vendas, previsões de cargas do servidor ou tempo de inatividade do servidor
  • Risco e probabilidade — escolher os melhores clientes para correspondências direcionadas, determinar o ponto de equilíbrio provável para cenários de risco, atribuir probabilidades a diagnósticos ou outros resultados
  • Recomendações — determinar quais produtos têm probabilidade de serem vendidos juntos, gerando recomendações
  • Encontrar sequências — analisar as seleções do cliente em um carrinho de compras, prever os próximos eventos prováveis
  • Agrupamento — separar clientes ou eventos em grupos de itens relacionados, analisando e prevendo afinidades

Esses cenários podem ser explorados para descobrir associações (é o caso das fraldas/cervejas) e sequências, classificar os atributos dos conjuntos de dados, aplicar técnicas estatísticas de regressão, clusterização e sumarização, detectar desvios e realizar previsão de séries temporais.

Leia o artigo completo para aprender como construir modelos de data mining

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Rolar para cima