Engenheiros da Yandex publicaram um artigo científico no qual revelaram os princípios de funcionamento de uma rede neural que permite o reconhecimento de comandos de voz em condições de ruído externo. A empresa já utiliza essa tecnologia e agora desenvolvedores em todo o mundo poderão implementá-la.
Fonte da imagem: yandex.ru/company
O trabalho será apresentado na conferência internacional de tecnologia da fala Interspeech, que será realizada de 17 a 21 de agosto em Roterdã, na Holanda; outros participantes incluem Microsoft, Google DeepMind e Google AR.
A tecnologia desenvolvida pelos especialistas da Yandex é usada em alto-falantes inteligentes e emissoras de TV. Ela permite que dispositivos com Alice interpretem corretamente os comandos de voz caso algo esteja tentando interferir: música tocando, água fazendo barulho, uma festa agitada ou um canteiro de obras ecoando do lado de fora da janela — o sistema ouvirá o usuário, mesmo que ele não tente gritar por cima da música ou não desligue o aspirador de pó. Usando essa tecnologia, qualquer empresa poderá melhorar a qualidade do assistente de voz com inteligência artificial e reduzir a taxa de falsos positivos.
Se a voz humana for ouvida contra o fundo musical, algoritmos de cancelamento de eco são considerados eficazes; no caso de outras fontes externas, o cancelamento de ruído funciona melhor, o que, no entanto, também piora a inteligibilidade da fala humana. Por isso, o Yandex desenvolveu um mecanismo de atenção baseado em redes neurais: ambos os sinais, com cancelamento de eco e ruído, são enviados à entrada simultaneamente, e o sistema seleciona dinamicamente o mais nítido, adaptando-se ao fundo sonoro de fontes de diferentes naturezas.
A AWS publicou uma descrição técnica da arquitetura de rede de data center que implementará…
Durante um teste estático de ignição em 29 de maio de 2026, o foguete New…
A editora Dotemu (Ninja Gaiden: Ragebound, Marvel Cosmic Invasion) e a Triskell Interactive, desenvolvedora de…
A Alphabet não é apenas uma das maiores empresas do mercado de serviços em nuvem,…
Cristiano Amon, CEO da Qualcomm, apresentou a plataforma robótica Dragonwing IQ10 atualizada na Computex 2026.…
A editora DreadXP e o estúdio britânico Lovely Hellplace (Dread Delusion) anunciaram a data de…