A empresa Yandex falou sobre as novas capacidades da assistente de voz Alice. Em particular, o sistema aprendeu a falar sussurrando. Este recurso é útil quando o assistente de voz precisa ficar mais silencioso, por exemplo, para não acordar crianças ou outros membros da família. Além disso, tendo ouvido o sussurro, “Alice” agora começa a falar da mesma maneira.

Fonte da imagem: Yandex

Para perceber essa oportunidade, os engenheiros da Yandex primeiro treinaram a rede neural para reconhecer um sussurro, levando em consideração as peculiaridades de seu espectro vocal. Quando uma pessoa fala em um sussurro, ela não usa as cordas vocais, o que muda o espectro vocal da fala. Ao mesmo tempo, o assistente de voz aprendeu a distinguir um sussurro de formatos de fala semelhantes – com um resfriado, a voz humana também pode mudar, mas Alice ainda não os confunde, segundo Yandex.

Na segunda etapa, foi necessário treinar o sistema não só para perceber, mas também para reproduzir um sussurro, o que exigiu a participação da atriz Tatyana Shitova, em cuja voz “Alice” fala. Portanto, a Sra. Shitova teve que gravar várias horas de sussurros para o assistente de voz. Como resultado, “Alice” agora é capaz de reconhecer o formato da fala humana, ajustar-se automaticamente a ele e alternar.

O chefe da divisão de dispositivos inteligentes da Yandex, Sergey Melnik, comentou sobre a inovação: “Alice é amada de várias maneiras porque se parece com uma pessoa. Você pode brincar e conversar com ela, ela tem seu próprio caráter e senso de humor. O sussurro é outra manifestação humana que agora é característica de Alice. Devo dizer que ela já dominou várias opções de voz. Por exemplo, Alice lidera o programa matinal com alegria e alegria, e traduz o vídeo de uma forma mais fleumática para não distrair de assistir. ” No futuro, a empresa planeja continuar ensinando ao assistente de voz novos estilos e emoções de fala, tornando “Alice” cada vez mais humana.

avalanche

Postagens recentes

A Nvidia aprimorou o ReSTIR: o traçado de raios ficou de 2 a 3 vezes mais rápido e preciso.

Pesquisadores da Nvidia publicaram um novo artigo intitulado "Enhanced ReSTIR PT: Algorithmic Enhancements for Faster…

48 minutos atrás

Os óculos de inteligência artificial da Huawei, com câmera e tradutor integrados, já estão disponíveis por US$ 370.

A Huawei apresentou novos óculos inteligentes, que contam com diversas novidades em relação à versão…

3 horas atrás

“Algumas pessoas estudam história, e outras a fazem”: o primeiro trailer de jogabilidade de Tropico 7 mostrou como é administrar uma ilha paradisíaca.

A editora Kalypso Media e os desenvolvedores do estúdio alemão Gaming Minds Studios anunciaram o…

3 horas atrás