Yandex revela algoritmo para reconhecimento de comandos de voz em condições ruidosas

Engenheiros da Yandex publicaram um artigo científico no qual revelaram os princípios de funcionamento de uma rede neural que permite o reconhecimento de comandos de voz em condições de ruído externo. A empresa já utiliza essa tecnologia e agora desenvolvedores em todo o mundo poderão implementá-la.

Fonte da imagem: yandex.ru/company

O trabalho será apresentado na conferência internacional de tecnologia da fala Interspeech, que será realizada de 17 a 21 de agosto em Roterdã, na Holanda; outros participantes incluem Microsoft, Google DeepMind e Google AR.

A tecnologia desenvolvida pelos especialistas da Yandex é usada em alto-falantes inteligentes e emissoras de TV. Ela permite que dispositivos com Alice interpretem corretamente os comandos de voz caso algo esteja tentando interferir: música tocando, água fazendo barulho, uma festa agitada ou um canteiro de obras ecoando do lado de fora da janela — o sistema ouvirá o usuário, mesmo que ele não tente gritar por cima da música ou não desligue o aspirador de pó. Usando essa tecnologia, qualquer empresa poderá melhorar a qualidade do assistente de voz com inteligência artificial e reduzir a taxa de falsos positivos.

Se a voz humana for ouvida contra o fundo musical, algoritmos de cancelamento de eco são considerados eficazes; no caso de outras fontes externas, o cancelamento de ruído funciona melhor, o que, no entanto, também piora a inteligibilidade da fala humana. Por isso, o Yandex desenvolveu um mecanismo de atenção baseado em redes neurais: ambos os sinais, com cancelamento de eco e ruído, são enviados à entrada simultaneamente, e o sistema seleciona dinamicamente o mais nítido, adaptando-se ao fundo sonoro de fontes de diferentes naturezas.

admin

Postagens recentes

A aposta na IA dá certo: o lucro líquido da Microsoft sobe 23% graças ao Azure e à OpenAI.

A Microsoft anunciou seus resultados financeiros para o segundo trimestre do ano fiscal de 2026.…

4 horas atrás

A Vivo suspendeu o desenvolvimento de óculos inteligentes com inteligência artificial devido às perspectivas incertas.

A Vivo suspendeu o desenvolvimento de seus óculos inteligentes com inteligência artificial, que estavam em…

5 horas atrás

O filme de ação à moda antiga Scott Pilgrim EX, dos criadores de As Tartarugas Ninja: A Vingança do Destruidor, não vai te deixar esperando muito tempo – data de lançamento e novo trailer.

O estúdio canadense Tribute Games (Teenage Mutant Ninja Turtles: Shredder’s Revenge, Marvel Cosmic Invasion) anunciou…

6 horas atrás

A Meta aumentou sua receita publicitária e sua audiência, com suas ações subindo 10%.

No quarto trimestre do ano passado, a receita da Meta✴Platforms, fundada por Mark Zuckerberg, cresceu…

7 horas atrás