Yandex revela algoritmo para reconhecimento de comandos de voz em condições ruidosas

Engenheiros da Yandex publicaram um artigo científico no qual revelaram os princípios de funcionamento de uma rede neural que permite o reconhecimento de comandos de voz em condições de ruído externo. A empresa já utiliza essa tecnologia e agora desenvolvedores em todo o mundo poderão implementá-la.

Fonte da imagem: yandex.ru/company

O trabalho será apresentado na conferência internacional de tecnologia da fala Interspeech, que será realizada de 17 a 21 de agosto em Roterdã, na Holanda; outros participantes incluem Microsoft, Google DeepMind e Google AR.

A tecnologia desenvolvida pelos especialistas da Yandex é usada em alto-falantes inteligentes e emissoras de TV. Ela permite que dispositivos com Alice interpretem corretamente os comandos de voz caso algo esteja tentando interferir: música tocando, água fazendo barulho, uma festa agitada ou um canteiro de obras ecoando do lado de fora da janela — o sistema ouvirá o usuário, mesmo que ele não tente gritar por cima da música ou não desligue o aspirador de pó. Usando essa tecnologia, qualquer empresa poderá melhorar a qualidade do assistente de voz com inteligência artificial e reduzir a taxa de falsos positivos.

Se a voz humana for ouvida contra o fundo musical, algoritmos de cancelamento de eco são considerados eficazes; no caso de outras fontes externas, o cancelamento de ruído funciona melhor, o que, no entanto, também piora a inteligibilidade da fala humana. Por isso, o Yandex desenvolveu um mecanismo de atenção baseado em redes neurais: ambos os sinais, com cancelamento de eco e ruído, são enviados à entrada simultaneamente, e o sistema seleciona dinamicamente o mais nítido, adaptando-se ao fundo sonoro de fontes de diferentes naturezas.

admin

Postagens recentes

A ESA lançou dois satélites Celeste em órbita para testar novas tecnologias de navegação.

A Agência Espacial Europeia (ESA) anunciou o lançamento bem-sucedido dos dois primeiros satélites da missão…

6 horas atrás

Os preços dos processadores Intel Arrow Lake Refresh subiram acima dos níveis recomendados 48 horas após o início das vendas.

No início deste mês, a Intel anunciou os processadores Arrow Lake Refresh, lançando o Core…

6 horas atrás

O Telegram afirma que não há nenhuma vulnerabilidade perigosa no aplicativo de mensagens.

O serviço de imprensa do Telegram afirmou que a vulnerabilidade crítica no aplicativo, recentemente relatada,…

8 horas atrás

As ações dos fabricantes de DRAM se estabilizam após o impacto inicial do TurboQuant.

Esta semana, o Google apresentou o TurboQuant, seu método de compressão de dados para IA,…

10 horas atrás

O lucro anual da BYD caiu pela primeira vez em quatro anos, expondo os horrores da guerra de preços na China.

A empresa chinesa BYD alcançou a liderança no mercado global de veículos elétricos, apesar de…

11 horas atrás