Antônio Ribeiro Neto
A possibilidade de interagir com máquinas a partir da forma mais natural de comunicação já extrapolou, há algum tempo, os limites da ficção científica ou dos laboratórios de pesquisa. Conforme estudos da Allied Business Intelligence, as tecnologias de processamento de fala – que incluem Reconhecimento de Fala (ASR), Síntese de Voz (text-to-speech) e Autenticação de Locutor – geraram uma receita mundial de cerca de US$ 1 bilhão em 2003, e deve atingir US$ 7 bilhões em 2008.
A participação do Hemisfério Sul (com exceção da Austrália) nesse total foi de 6% no ano passado e, conforme as projeções daquele instituto de pesquisas, não ultrapassaria 9% em 2008. No Brasil, as tecnologias de processamento de fala utilizadas até o momento são importadas de grandes multinacionais, com preço em dólar, o que restringe suas aplicações a grandes centrais de atendimento nos setores financeiro e de telecomunicações.
Entretanto, tecnologias brasileiras para reconhecimento e síntese de fala, e também autenticação de locutor, estão chegando ao mercado e prometem mudar este cenário a partir de 2005.
Se considerarmos apenas os nichos já explorados pela tecnologia, os fabricantes nacionais de equipamentos de telefonia, call center e auto-atendimento podem incorporar as novas facilidades em seus produtos, com uma diferença de custo estimada em 50%. Contudo, a disponibilidade de tecnologia nacional abre espaço para que industriais e engenheiros levem a tecnologia a faixas mais amplas de produtos, em áreas como automação residencial, predial e automotiva, ou dispositivos de segurança.
Assim, podem-se atingir setores como saúde, viagens, comércio, manufatura, serviços públicos e governo, que ainda não utilizam este tipo de tecnologia principalmente devido ao custo de suas licenças e da implementação altamente especializada. Além da questão de preços, a reduzida participação do Brasil no mercado mundial torna pouco provável a vinda de empresas estrangeiras focadas nos segmentos de pequenas e médias empresas.
Graças à articulação de um grupo capacitado de pesquisadores e engenheiros, de várias universidades, e aos mecanismos oficiais de alavancagem ao setor de software, o trabalho desenvolvido nos últimos três anos já resultou em soluções, prontas para serem aplicadas. Todavia, o sucesso da tecnologia depende da capacitação tecnológica e do senso de oportunidade dos fornecedores, integradores e canais de distribuição de produtos eletro-eletrônicos, de informática e telefonia.
Portanto, a tarefa dos centros de Pesquisa e Desenvolvimento não se restringe à produção da tecnologia. É necessário especialmente disseminar o conhecimento específico de como desenvolver aplicações utilizando esta tecnologia, para que possa então ser um fator de geração de riqueza para mais e mais indústrias no país.
Os benefícios gerados pelas tecnologias de processamento de fala vão além da simples facilidade de interação homem/máquina. Acessibilidade para deficientes visuais ou pessoas semi-alfabetizadas, ampliação do alcance dos serviços de eGov, transações mais seguras por telefone ou em portais de voz (com autenticação biométrica por padrão de voz) e agilização das operações de atendimento são aplicações com claro retorno de investimento.
Há ainda as motivações subjetivas. Um distribuidor de máquinas de café quer incorporar os recursos de Reconhecimento de Fala e Síntese de Voz nas unidades instaladas nas áreas de diretoria de seus clientes, para impressionar os visitantes. Na prática, a tecnologia é usada para que o diretor, a empresa e o fornecedor façam seu marketing. O resultado é vender mais café.
Antônio Ribeiro Neto é diretor-superintendente do Genius Instituto de Tecnologia.