Autor: Alessandra de Ávila Montini
As principais empresas mundiais, com o crescimento das informações, estão investindo muito na armazenagem de informações. Após o armazenamento dos dados, é necessária a elaboração de um adequado banco de dados com as informações unificadas e consistidas eliminando, por exemplo, registros duplicados e dados incoerentes.
Com a tecnologia existente hoje, que permite armazenar muitos dados em pequenos discos e com a velocidade de acesso a informação gerada pelos softwares, é possível gerar muitas informações que facilitam a tomada de decisão de diversas áreas das empresas e originam uma redução de custo. A estatística tem um papel vital na qualificada extração das informações e na elaboração de modelos que transformam os dados originais em relatórios gerenciais que auxiliam na tomada de decisão.
A base de qualquer modelo está na adequada extração das informações do banco de dados. Aqui a estatística tem um papel fundamental, pois auxilia na metodologia de amostragem e fornece várias maneiras de imputação de informações perdidas.
A estatística permite por meio das técnicas poderosas de data mining trabalhar com toda a base de dados ou com uma amostra representativa do processo. As técnicas tradicionais de estatísticas muitas vezes não são adequadas para trabalhar com uma massa grande de informações. Aqui, o data mining possui um diferencial no tratamento da informação.
O data mining possui uma grande gama de aplicações e pode ajudar a empresa a reduzir brutalmente seus custos. Hoje, ele é muito utilizado para detectar padrão de comportamento de clientes, perfil de utilização do cartão de crédito, perfil de telespectadores que assistem um determinado programa, pode auxiliar em campanhas de marketing e determinar, por exemplo, o perfil de pacientes que possuem determinadas doenças.
Uma grande aplicação do data mining é a determinação do perfil de fraudadores de seguros. Por meio desta técnica é possível determinar a região, o bairro e, por exemplo, a forma de roubo de veículos. Com o cruzamento dessas informações com o perfil do segurado, é possível localizar quadrilhas que agem de forma similar. Antigamente não era possível fazer o cruzamento de uma grande massa de informações, agora conseguimos estabelecer até a rede de relacionamentos dos fraudadores de seguros. Isto faz lembrar aquele ditado popular “Diga-me com quem andas que direi quem és”.
Alessandra de Ávila Montini é coordenadora do curso Análise de Dados e Data Mining da FIA (Fundação Instituto de Administração).