Jornal Correio Braziliense

Tecnologia

Pesquisadores da UnB desenvolvem método que melhora atual sistema de comando por reconhecimento de voz

Estudo pode significar mais comodidade e segurança para portadores de necessidades especiais

Noeme Rocha da Silva, 49 anos, ficou cega depois de sofrer um acidente automobilístico há duas décadas, na Ponte das Garças, no Lago Sul. Ainda assim, enfrentou e ultrapassou todos os obstáculos que a acessibilidade precária no Brasil colocou em seu caminho. Ela cursou a faculdade de filosofia, fez pós-graduação em gestão de pessoas e deve concluir, no fim deste ano, o segundo curso superior, em assistência social. Noeme é uma das cerca de 23,7 milhões de pessoas portadoras de necessidades especiais no país (dados do Instituto Brasileiro de Geografia e Estatística, IBGE) que podem ser beneficiadas com o aperfeiçoamento do atual sistema de reconhecimento de voz por computadores. Um grupo de pesquisadores da Universidade de Brasília (UnB) estuda maneiras de reduzir a margem de erro e produzir sistemas mais eficientes. O bom desenvolvimento dessa tecnologia é um passo gigantesco para melhorar o grau de acessibilidade de portadores de necessidades especiais. Além disso, o recurso pode ser transformado em mais segurança e comodidade. Durante a calibragem da máquina que irá reconhecer os comandos, os cientistas trabalham com um programa que faz a caracterização do áudio gravado, usando informações do funcionamento do sistema auditivo humano. "Os ruídos atrapalham bastante todo o sistema de reconhecimento de voz. O nosso maior desafio é atingir bons resultados em ambientes externos, porque, no laboratório, o percentual de acerto chega a 100%", explica Bruno de Assis Rolim, integrante do grupo que pesquisa o assunto na UnB. "A questão do reconhecimento de comandos é bem resolvida no campo da inteligência artificial (1). O gargalo do estudo é o treinamento, a calibragem do sistema. Quanto mais precisa for essa etapa, melhor será o resultado final", completa o cientista. Longe dos ambientes ideais dos laboratórios, a fragilidade nos sistemas de reconhecimento de voz atualmente disponíveis no mercado é latente em situações muito simples. A tentativa de uma ligação em um telefone celular é frustrante. Ao ordenar um telefonema para alguém chamado Mauro, o usuário frequentemente pode ser conectado com outro, por exemplo, de nome Lauro. No caso de Noeme, a aplicação prática do sistema de reconhecimento de voz por computadores, quando resultados expressivos forem alcançados, poderá ser encontrada em inúmeras situações. No ambiente acadêmico, por exemplo, onde Noeme paga uma pessoa para acompanhá-la nas aulas, ajudá-la com a leitura dos materiais de apoio e digitar os trabalhos do curso, um computador poderia resolver esses problemas. Para tanto, depois de dizer em qual sala teria aula, um aparelho de GPS daria as coordenadas para que a estudante pudesse andar pelos corredores da universidade. Um computador equipado com o programa de reconhecimento de comandos seria capaz de ler textos e digitar os trabalhos para Noeme. "Com certeza, esse tipo de recurso iria facilitar a minha rotina. Não é muito fácil encontrar livros em braille (2) nas faculdades. O esforço dos portadores de necessidades especiais é muito grande, e todo tipo de tecnologia é bem-vinda para melhorar as nossas vidas", avalia Noeme. Ela ainda explica que cada página impressa com tipografia comum equivale a quatro páginas em alfabeto braille. "Eu demoraria menos tempo escrevendo, carregaria menos peso para os lugares, além de economizar um bom dinheiro. Isso faria com que eu conseguisse alcançar com mais tranquilidade o meu objetivo de fazer um pós-doutorado", diz. Ouça entrevista com o cientista Bruno Rolim Trânsito Se as conquistas ainda restritas aos laboratórios forem reproduzidas comercialmente, carros adaptados para pessoas que não têm os movimentos dos membros inferiores poderão receber comandos mais complexos, com segurança para o motorista. Um paraplégico que só pode acelerar e frear o veículo com as mãos, por exemplo, passaria a ter a possibilidade de ordenar outras funções, como acender os faróis, mudar a estação do rádio ou regular o retrovisor sem que a atenção no trânsito seja desviada. No entanto, a realidade ideal para os milhões de portadores de necessidades especiais está distante, de acordo com o cogestor do projeto na UnB Pedro Berger. Segundo ele, o sistema atual permite o uso com comandos limitados, como abrir e fechar portas, ligar e desligar a televisão ou discar números no telefone. Um sistema que pudesse aceitar qualquer tipo de comando dado por várias pessoas é algo que irá demandar muitos anos de pesquisa e o surgimento de novas teorias probabilísticas. "Para um sistema que será operado por até três usuários, e com um número de comandos bastante limitado, o percentual de acerto chega, com facilidade, a 100%. O problema é quando a necessidade aponta para um sistema mais genérico, com a demanda de muitas funções. Nesses casos, a margem de erro, por enquanto, aumenta consideravelmente", analisa Berger. Qualidade de vida O técnico em informática Ystônio Vieira da Silva, 35 anos, levou um tiro quando tinha 15. O ferimento causou uma grave lesão na coluna e o deixou paraplégico. Sem o movimento das pernas, Silva enfrenta algumas dificuldades para realizar tarefas aparentemente banais. Ele ressalta que, mesmo com ótima habilidade nos membros superiores, o cotidiano apresenta situações que o sistema de reconhecimento de voz por computadores poderia resolver. "As pessoas não imaginam o quanto pode ser complicado abrir a porta de casa, principalmente, para quem não tem a atividade motora bem desenvolvida nos membros superiores. São várias tarefas: procurar as chaves no bolso, enfiá-la na fechadura, alcançar a maçaneta. Agora, chegar em casa e abrir a porta por meio de um comando de voz seria bem mais confortável", destaca Silva. "Os portadores de necessidades especiais enfrentam, normalmente, muitos obstáculos difíceis. Por isso, toda e qualquer facilidade é fundamental para melhorar a qualidade de vida". O cientista Pedro Berger concorda que a tecnologia pode ser muito útil para melhorar o dia a dia da sociedade, mas faz uma ressalva sobre o cuidado com a aplicação de recursos como o reconhecimento de voz por computador. "O sistema que está disponível no mercado não permite que o reconhecimento de comando seja utilizado em situações extremas de perigo ou estresse. Uma coisa é o software não reconhecer o pedido do usuário para mudar o canal da televisão. Outra coisa é o sistema falhar no trânsito, quando a pessoa pede para que o freio seja acionado", conclui. 1- Simulação do humano Criado no início da Segunda Guerra Mundial, o conceito de inteligência artificial é usado para definir o campo da ciência da computação que traz, por meio de cálculos matemáticos e símbolos computacionais, características e ações que lembrem ou simulem o ser humano. 2- Leitura para cegos O alfabeto braille, criado pelo francês Louis Braille no início do século 19, é um sistema de leitura para cegos, que prevê o uso do tato para sentir pontos em alto relevo. Cada palavra é organizada em pontos dispostos em cédulas de três linhas e duas colunas. Um bom conhecedor do sistema braille de leitura consegue identificar até 200 palavras por minuto. Para saber mais O sonho de Graham Bell O sistema de reconhecimento de voz é muito mais antigo do que se pode imaginar. Ainda no século 19, por exemplo, há notícias de que Alexander Graham Bell, considerado o inventor do telefone, criou um dispositivo que transformava áudios em imagens que podiam ser interpretadas. Bell procurava uma maneira de se comunicar mais facilmente com a esposa, que era surda. O inventor escocês conseguiu que palavras fossem convertidas em símbolos, mas a mulher de Bell não era capaz de decifrar as imagens. Mesmo com a tentativa malsucedida de operar um sistema de reconhecimento de voz, Alexander Graham Bell continuou com o interesse em aparelhos de comunicação, o que levou, anos mais tarde, à invenção do telefone.