Um programa de computador que “ouve” uma pessoa e é capaz de definir, com 83% de acerto em média, se ela está feliz, triste ou entediada ou ainda com raiva, nojo ou medo, pode se tornar uma ferramenta valiosa para empresas de contact centers, identificando situações de conflito nas ligações. Desenvolvido por um pesquisador da Escola Politécnica da Universidade de São Paulo (Poli-USP), o engenheiro Rafael Iriya, o programa apresentou taxas de reconhecimento elevadas comparadas a outros sistemas no mundo.
Para as empresas possibilitaria que um supervisor interviesse para ajudar o operador durante uma ligação que apresentasse uma situação de conflito. No pós-atendimento, poderia ser usado como ferramenta de controle de qualidade ou para treinamento, visto que o programa possibilitaria triar rapidamente as gravações.
Nos testes foram utilizadas uma base de dados pública, a Berlin Database of Emocional Speech, que contém gravações de áudio com atores interpretando determinadas emoções. O autor do projeto processou e extraiu dos sinais parâmetros que caracterizam a voz em determinada emoção – trato vocal, frequência da voz, intensidade sonora etc. “Para cada emoção, estes parâmetros apresentam configurações diferentes, que evoluem de maneira diversa conforme a pessoa entona uma frase”, explica Iriya.
Para evitar um modelo genérico, o pesquisador utilizou vários tipos de entonação, de forma que a máquina pudesse reconhecer quais alterações na voz caracterizam cada emoção. “Foram utilizadas várias frases, faladas por diferentes pessoas, para criar o modelo de cada emoção.” Na prática, a aplicação deste programa requererá uma base de dados mais ampla, com milhares de gravações em áudio na língua desejada. Ou mais especificamente, uma base de dados em um contexto parecido com o do cenário prático, como as próprias gravações de um contact center.