Yandex revela algoritmo para reconhecimento de comandos de voz em condições ruidosas

Engenheiros da Yandex publicaram um artigo científico no qual revelaram os princípios de funcionamento de uma rede neural que permite o reconhecimento de comandos de voz em condições de ruído externo. A empresa já utiliza essa tecnologia e agora desenvolvedores em todo o mundo poderão implementá-la.

Fonte da imagem: yandex.ru/company

O trabalho será apresentado na conferência internacional de tecnologia da fala Interspeech, que será realizada de 17 a 21 de agosto em Roterdã, na Holanda; outros participantes incluem Microsoft, Google DeepMind e Google AR.

A tecnologia desenvolvida pelos especialistas da Yandex é usada em alto-falantes inteligentes e emissoras de TV. Ela permite que dispositivos com Alice interpretem corretamente os comandos de voz caso algo esteja tentando interferir: música tocando, água fazendo barulho, uma festa agitada ou um canteiro de obras ecoando do lado de fora da janela — o sistema ouvirá o usuário, mesmo que ele não tente gritar por cima da música ou não desligue o aspirador de pó. Usando essa tecnologia, qualquer empresa poderá melhorar a qualidade do assistente de voz com inteligência artificial e reduzir a taxa de falsos positivos.

Se a voz humana for ouvida contra o fundo musical, algoritmos de cancelamento de eco são considerados eficazes; no caso de outras fontes externas, o cancelamento de ruído funciona melhor, o que, no entanto, também piora a inteligibilidade da fala humana. Por isso, o Yandex desenvolveu um mecanismo de atenção baseado em redes neurais: ambos os sinais, com cancelamento de eco e ruído, são enviados à entrada simultaneamente, e o sistema seleciona dinamicamente o mais nítido, adaptando-se ao fundo sonoro de fontes de diferentes naturezas.

admin

Postagens recentes

As remessas globais de chips ultrapassaram US$ 400 bilhões este ano, e a expectativa é de que esse número aumente ainda mais no próximo ano.

A Nvidia é amplamente considerada um exemplo brilhante de como lucrar com o boom da…

41 minutos atrás

A situação já era boa: a Tesla começou a preparar os investidores para mais um colapso nas vendas de carros elétricos.

No ano passado, pela primeira vez em sua história, a Tesla encerrou o ano com…

41 minutos atrás

O primeiro sistema de armazenamento de energia renovável por ar liquefeito do mundo foi lançado na China.

A energia renovável aborda questões ambientais, mas também apresenta desafios técnicos. O principal deles é…

51 minutos atrás

Seguindo os passos da Samsung: a LG apresentará as TVs LG Gallery na CES 2026.

A LG anunciou planos para lançar uma nova categoria de televisores, a LG Gallery TV,…

2 horas atrás