Engenheiros da Yandex publicaram um artigo científico no qual revelaram os princípios de funcionamento de uma rede neural que permite o reconhecimento de comandos de voz em condições de ruído externo. A empresa já utiliza essa tecnologia e agora desenvolvedores em todo o mundo poderão implementá-la.

Fonte da imagem: yandex.ru/company
O trabalho será apresentado na conferência internacional de tecnologia da fala Interspeech, que será realizada de 17 a 21 de agosto em Roterdã, na Holanda; outros participantes incluem Microsoft, Google DeepMind e Google AR.
A tecnologia desenvolvida pelos especialistas da Yandex é usada em alto-falantes inteligentes e emissoras de TV. Ela permite que dispositivos com Alice interpretem corretamente os comandos de voz caso algo esteja tentando interferir: música tocando, água fazendo barulho, uma festa agitada ou um canteiro de obras ecoando do lado de fora da janela — o sistema ouvirá o usuário, mesmo que ele não tente gritar por cima da música ou não desligue o aspirador de pó. Usando essa tecnologia, qualquer empresa poderá melhorar a qualidade do assistente de voz com inteligência artificial e reduzir a taxa de falsos positivos.
Se a voz humana for ouvida contra o fundo musical, algoritmos de cancelamento de eco são considerados eficazes; no caso de outras fontes externas, o cancelamento de ruído funciona melhor, o que, no entanto, também piora a inteligibilidade da fala humana. Por isso, o Yandex desenvolveu um mecanismo de atenção baseado em redes neurais: ambos os sinais, com cancelamento de eco e ruído, são enviados à entrada simultaneamente, e o sistema seleciona dinamicamente o mais nítido, adaptando-se ao fundo sonoro de fontes de diferentes naturezas.
