Conteúdo mais inteligente?



Autor:Leonardo Vieiralves Azevedo

 A maior parte das pessoas que trabalha com dispositivos digitais não se dá conta do volume de dados desestruturados com o qual lidamos hoje e dos potenciais benefícios que podemos auferir ao geri-los de uma forma eficiente.  O Google é um exemplo, dado que com seu sistema de busca e indexação, somos capazes de achar informação sobre qualquer assunto, nas mais disparatadas fontes e origens. Para ajudar nas definições, podemos entender que dados desestruturados compreendem todas informações que não estão organizados sob a forma de tabelas e campos, tipicamente em sistemas gerenciadores de bancos de dados. Para fins desse artigo, vamos nos ater ao conteúdo não estruturado que contenha informações textuais.

Do ponto de vista de inteligência de negócios, há várias potenciais aplicações para análises de dados desestruturados. Entendimento das principais demandas e reclamações dos clientes expostas nos textos da central de atendimento ou nos e-mails recebidos, além de análises da percepção da marca em mídias sociais, são alguns exemplos de aplicações que usam essa abordagem.

Uma das possíveis análise é das próprias palavras ou expressões utilizadas, adotada principalmente para textos curtos, como uma descrição de um atendimento em contact center ou um tweet. Nesse caso, transforma-se o conteúdo originalmente desestruturado em uma tabela, onde cada coluna é um termo. Nas linhas, marca-se a ocorrência do termo em uma determinada extração do texto, por exemplo, vinculada a um cliente. O texto é analisado em relação a um determinado comportamento do cliente, como a compra de um produto. A partir daí, procura-se entender se a ocorrência de determinadas expressões influencia no comportamento estudado. Digamos que é um método de data mining tradicional aplicado ao conteúdo.

Outra tática é aplicar algum tipo de análise semântica sobre os conteúdos. Aqui é necessário contar com mecanismos de análise que permitam relacionar contextos e extrair conceitos mais relevantes dos documentos. O que temos visto com mais frequência são artefatos como nuvens semânticas, aquele conjunto de palavras que vemos em alguns sites da web onde aparecem termos em maior ou menor tamanho, segunda a relevância. Note que uma nuvem semântica de verdade é bem mais complexa que um simples contador de palavras.

E, recentemente, a IBM demonstrou uma nova fronteira da pesquisa científica em análise de conteúdo, ao fazer o super computador Watson vencer um famoso jogo de perguntas e respostas norte americano, o Jeopardy. Isso só foi possível com análises de conteúdo muito velozes e relacionais.

Enquanto isso, boa parte do conteúdo segue sem nenhum tipo de gestão. Mesmo as buscas, no ambiente corporativo, seguem muito limitadas e distantes da eficácia que o Google nos dá na web. Os próximos anos revelarão muitos avanços nessa área. Tomara que eles estejam rapidamente ao nosso alcance.

Mãos à obra!

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Rolar para cima