Autor convidado: Elcio Santos, AlwaysOn
Você certamente conhece a história. Uma grande rede de mercados norte-americana, ao analisar as transações de compras, teria descoberto que um número razoável de compradores de fraldas também comprava cerveja na véspera de finais de semana.
A análise também apontou que esses compradores eram homens que, ao comprarem fraldas para seus filhos, compravam também cerveja para consumo enquanto cuidavam das crianças e assistiam aos jogos na televisão durante o final de semana.
A empresa teria utilizado esse novo conhecimento (data analytics) para colocar lado a lado as gôndolas de fraldas e cervejas na rede de mercados, incrementando assim a venda conjunta dos dois produtos.
Infelizmente, ninguém pode realmente atestar a veracidade da história.
Ora fala-se que as fraldas eram da marca Pampers, ora fala-se em Johnson & Johnson. Alguns citam a Target como a empresa que fez as análises, outros falam no Walmart (caso alguém tenha alguma informação que possa desanuviar o assunto, dividida conosco).
Talvez tenha sido um experimento mental – que nem o Gato de Schrödinger – que fazia sentido.
Tanto que entrou para o folclore da administração.
E faz sentido mesmo, pois ilustra uma das grandes vantagens do Data Mining
O que é Data Mining
A expressão significa mineração de dados em português.
É o processo de descobrir informações acionáveis em grandes conjuntos de dados.
A atividade de Data Mining usa análise matemática para derivar padrões e tendências que existem nos dados.
Normalmente, esses padrões não podem ser descobertos pela exploração de dados tradicionais porque os relacionamentos são muito complexos ou porque há muitos dados.
Esses padrões e tendências podem ser coletados e definidos como um modelo de mineração de dados.
Os modelos de Data Mining podem ser aplicados a cenários específicos.
Por exemplo:
- Previsões — estimativas de vendas, previsões de cargas do servidor ou tempo de inatividade do servidor
- Risco e probabilidade — escolher os melhores clientes para correspondências direcionadas, determinar o ponto de equilíbrio provável para cenários de risco, atribuir probabilidades a diagnósticos ou outros resultados
- Recomendações — determinar quais produtos têm probabilidade de serem vendidos juntos, gerando recomendações
- Encontrar sequências — analisar as seleções do cliente em um carrinho de compras, prever os próximos eventos prováveis
- Agrupamento — separar clientes ou eventos em grupos de itens relacionados, analisando e prevendo afinidades
Esses cenários podem ser explorados para descobrir associações (é o caso das fraldas/cervejas) e sequências, classificar os atributos dos conjuntos de dados, aplicar técnicas estatísticas de regressão, clusterização e sumarização, detectar desvios e realizar previsão de séries temporais.
Leia o artigo completo para aprender como construir modelos de data mining