Yandex revela algoritmo para reconhecimento de comandos de voz em condições ruidosas

Engenheiros da Yandex publicaram um artigo científico no qual revelaram os princípios de funcionamento de uma rede neural que permite o reconhecimento de comandos de voz em condições de ruído externo. A empresa já utiliza essa tecnologia e agora desenvolvedores em todo o mundo poderão implementá-la.

Fonte da imagem: yandex.ru/company

O trabalho será apresentado na conferência internacional de tecnologia da fala Interspeech, que será realizada de 17 a 21 de agosto em Roterdã, na Holanda; outros participantes incluem Microsoft, Google DeepMind e Google AR.

A tecnologia desenvolvida pelos especialistas da Yandex é usada em alto-falantes inteligentes e emissoras de TV. Ela permite que dispositivos com Alice interpretem corretamente os comandos de voz caso algo esteja tentando interferir: música tocando, água fazendo barulho, uma festa agitada ou um canteiro de obras ecoando do lado de fora da janela — o sistema ouvirá o usuário, mesmo que ele não tente gritar por cima da música ou não desligue o aspirador de pó. Usando essa tecnologia, qualquer empresa poderá melhorar a qualidade do assistente de voz com inteligência artificial e reduzir a taxa de falsos positivos.

Se a voz humana for ouvida contra o fundo musical, algoritmos de cancelamento de eco são considerados eficazes; no caso de outras fontes externas, o cancelamento de ruído funciona melhor, o que, no entanto, também piora a inteligibilidade da fala humana. Por isso, o Yandex desenvolveu um mecanismo de atenção baseado em redes neurais: ambos os sinais, com cancelamento de eco e ruído, são enviados à entrada simultaneamente, e o sistema seleciona dinamicamente o mais nítido, adaptando-se ao fundo sonoro de fontes de diferentes naturezas.

admin

Postagens recentes

Conforme as cartas forem lançadas, conforme a rede ditar: a AWS está implementando uma arquitetura de rede RNG quase aleatória em seus data centers.

A AWS publicou uma descrição técnica da arquitetura de rede de data center que implementará…

7 horas atrás

O chefe da NASA afirma que os voos do foguete New Glenn não serão retomados antes de 2028, eliminando a Blue Origin da corrida lunar.

Durante um teste estático de ignição em 29 de maio de 2026, o foguete New…

7 horas atrás

Foi anunciado o sucessor espiritual de Zeus: Master of Olympus – o jogo de estratégia de construção de cidades Theos: Cities of Myth, onde história e mito se entrelaçam.

A editora Dotemu (Ninja Gaiden: Ragebound, Marvel Cosmic Invasion) e a Triskell Interactive, desenvolvedora de…

8 horas atrás

Plataforma de referência de IA Qualcomm Dragonwing IQ10 para robótica é apresentada.

Cristiano Amon, CEO da Qualcomm, apresentou a plataforma robótica Dragonwing IQ10 atualizada na Computex 2026.…

8 horas atrás

O RPG infernal baseado em turnos, Entropy, do criador de Dread Delusion, recebeu uma demo e uma data de lançamento no Acesso Antecipado do Steam.

A editora DreadXP e o estúdio britânico Lovely Hellplace (Dread Delusion) anunciaram a data de…

8 horas atrás