Yandex revela algoritmo para reconhecimento de comandos de voz em condições ruidosas

Engenheiros da Yandex publicaram um artigo científico no qual revelaram os princípios de funcionamento de uma rede neural que permite o reconhecimento de comandos de voz em condições de ruído externo. A empresa já utiliza essa tecnologia e agora desenvolvedores em todo o mundo poderão implementá-la.

Fonte da imagem: yandex.ru/company

O trabalho será apresentado na conferência internacional de tecnologia da fala Interspeech, que será realizada de 17 a 21 de agosto em Roterdã, na Holanda; outros participantes incluem Microsoft, Google DeepMind e Google AR.

A tecnologia desenvolvida pelos especialistas da Yandex é usada em alto-falantes inteligentes e emissoras de TV. Ela permite que dispositivos com Alice interpretem corretamente os comandos de voz caso algo esteja tentando interferir: música tocando, água fazendo barulho, uma festa agitada ou um canteiro de obras ecoando do lado de fora da janela — o sistema ouvirá o usuário, mesmo que ele não tente gritar por cima da música ou não desligue o aspirador de pó. Usando essa tecnologia, qualquer empresa poderá melhorar a qualidade do assistente de voz com inteligência artificial e reduzir a taxa de falsos positivos.

Se a voz humana for ouvida contra o fundo musical, algoritmos de cancelamento de eco são considerados eficazes; no caso de outras fontes externas, o cancelamento de ruído funciona melhor, o que, no entanto, também piora a inteligibilidade da fala humana. Por isso, o Yandex desenvolveu um mecanismo de atenção baseado em redes neurais: ambos os sinais, com cancelamento de eco e ruído, são enviados à entrada simultaneamente, e o sistema seleciona dinamicamente o mais nítido, adaptando-se ao fundo sonoro de fontes de diferentes naturezas.

admin

Postagens recentes

A OneXPlayer definiu o preço do console de jogos portátil OneXPlayer 3, equipado com um processador Intel Arc G3 Extreme, a partir de US$ 1.399.

A OneXPlayer lançou uma campanha de financiamento coletivo para seu novo console portátil OneXPlayer 3,…

41 minutos atrás

O Google trouxe o Telegram de volta para a seção indiana da Play Store, enquanto a Apple está ficando para trás.

O Google reinstalou o aplicativo Telegram na Play Store indiana após uma proibição temporária que…

1 hora atrás

Um robô voador foi criado sem uma única hélice – ele plana em correntes ascendentes como um pássaro.

Cientistas do Instituto Max Planck de Sistemas Inteligentes em Tübingen e da Universidade de Stuttgart…

1 hora atrás

O grupo Anthropic Mythos invadiu quase todos os sistemas confidenciais da NSA em questão de horas.

Um modelo avançado de inteligência artificial, o Anthropic Mythos, conseguiu invadir "quase todos" os sistemas…

2 horas atrás

Estreia do gameplay de Saw: Genesis, um jogo de terror multiplayer baseado no universo cult dos filmes Saw.

Os desenvolvedores da Broken Mirror Games, com o apoio da editora Bloober Team e do…

2 horas atrás