Por que Data Mining? Para complicar ou para explicar?

O mundo dos negócios, assim como nossas vidas, vez por outra sofre a influência de modismos. São ondas que aparecem e desaparecem ao sabor dos ventos ou, refletindo melhor os dias de hoje, ao sabor das novas tecnologias. Sem dúvida, Data Mining é um tema quente e, como todas as novas ondas, devemos ter cuidado em separar o fato da fantasia.

Data Mining não é nenhuma novidade, há tempos em centros acadêmicos e de pesquisa técnicas sofisticadas nas áreas de estatística, matemática e machine learning são testadas e aperfeiçoadas com o objetivo de antecipar eventos, entretanto, apenas recentemente Data Mining passou a ser discutido em ambientes de negócio. A evolução tecnológica, mudanças culturais e mercados cada vez mais competitivos podem ser apontados como os principais fatores que levaram ao início desta discussão.

Data Mining é um processo mais do que apenas uma ferramenta ou tecnologia. A principal característica deste processo é estar centrado no descobrimento, revelando informações intrínsecas aos dados sem a necessidade de formulação de hipóteses. Pressupõem a existência de grandes volumes de dados bem como histórico.

Para deixar bastante claro o conceito de Data Mining, vamos ilustrar primeiramente o que não é Data Mining: análises OLAP (on line analytical processing) – baseadas em indicadores e dimensões – análises com base em query/report (pergunta formulada a uma base de dados) e estatística básica – regressão, análise fatorial e análise de discriminantes, por exemplo.

Nos três casos – OLAP, query/report e estatística básica – é necessário que o analista tenha uma hipótese a priori a ser confirmada – por exemplo, a de que homens com idade inferior a 35 anos, solteiros e com alto poder aquisitivo são mais propensos a investir em fundos de alto risco do que homens casados, na mesma faixa etária e de mesmo poder aquisitivo – uma vez confirmada a hipótese – utilizando-se de uma ou da combinação destas técnicas – o analista prossegue refinando sua análise, de acordo com seu bom senso, com o objetivo de resolver um problema de negócio, neste caso, alavancar a oferta de fundos de alto risco.

Este tipo de investigação não seria possível sem a hipótese levantada pelo analista, fruto de seu conhecimento relacionado ao negócio e à base de dados em questão. Sem este conhecimento, tanto a análise quanto seu objetivo final estariam comprometidos.

Data Mining parte de outro princípio – total isenção – sendo assim, não existem hipóteses a priori e o descobrimento do padrão de comportamento de um investidor agressivo é feito através de técnicas de inteligência artificial e estatística multivariada.

O emprego de inteligência artificial – Redes Neurais – representa um grande diferencial em Data Mining. Esta abordagem possibilita a construção de modelos mais próximos à realidade uma vez que as características dos dados encontrados nas empresas apresentam forte não linearidade. Os algoritmos de Redes Neurais tem uma capacidade de generalização e aprendizado muito eficientes o que garante uma maior precisão na identificação de padrões.

O resultado deste processo é muitas vezes inesperado, surpreendente. Suporta e, em muitos casos alavanca, a tomada de decisão. É, também, um acelerador do processo de conhecimento de uma base de dados por tornar visíveis padrões que, com as técnicas tradicionais de análise citadas anteriormente, levariam muito mais tempo para serem descobertos.

Em geral, as principais aplicações de Data Mining podem ser divididas em 2 áreas:

· Gestão de Clientes – Segmentação Comportamental, Análise da Formação e Desagregação de Portfólios, Otimização de Cesta de Mercado, Atribuição de Valor ao Cliente;

· Gestão de Custos Financeiros – Análise de Rentabilidade, Detecção de Fraude, Análise de Crédito, Performance de Canais, dentre outras.

Data Mining não é simples, faz uso de algoritmos sofisticados desenvolvidos em universidades e institutos de pesquisa. Mas, sem entrarmos no mérito de como estes algoritmos sofisticados são desenvolvidos, é importante entendermos que o sucesso na utilização de Data Mining depende em parte do negócio e, em parte, da experiência e criatividade do especialista em Data Mining, e, quando corretamente empregado, permite à empresa atuar de maneira proativa, antecipando-se aos eventos de maior impacto sobre seu negócio.

Assim, o perfil ideal de empresa que permitiria extrair máximo valor da utilização de Data Mining é aquela que possui, no mínimo, histórico de transações e informações cadastrais armazenadas, além de milhares de clientes, e que entende a importância estratégica de diferenciar-se da concorrência tendo como base o conhecimento sofisticado e preciso a respeito de seus clientes.


Marilisa Guilhen e Helena Gottschalk são sócias na Data Domus e dedicam-se a auxiliar as empresas a desenvolverem sua capacidade analítica e a utilizá-la estrategicamente na gestão do relacionamento com os seus clientes. [email protected]

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Rolar para cima