Os desenvolvedores da plataforma de nuvem Yandex Cloud atualizaram o serviço Yandex SpeechKit construído com base no aprendizado de máquina, projetado para síntese e reconhecimento de fala. Agora, ao traduzir voz em texto, o serviço adiciona automaticamente sinais de pontuação nos lugares certos.

Fonte da imagem: Reuters

O novo recurso é chamado de “Pontuador”. Funciona tanto no reconhecimento de fala online para cenários com assistentes de voz, quanto no processamento de arquivos de áudio pré-gravados. O novo recurso é baseado em dois modelos consecutivos de aprendizado de máquina. O primeiro traduz a voz em texto e o segundo coloca os sinais de pontuação de acordo com as normas da língua russa. Atualmente, a função mencionada lida com o arranjo dos principais sinais de pontuação do idioma russo. Todos os usuários do Yandex SpeechKit podem interagir com o Pontuador.

Os desenvolvedores estão confiantes de que a inovação melhorará a experiência do usuário em cenários que envolvem uma pessoa interagindo diretamente com tecnologias de fala. Em primeiro lugar, estamos falando de trabalhar com assistentes de voz, transcrição automática e formação de legendas. Nota-se que o texto reconhecido pela rede neural é o mais próximo possível do literário.

«Desenvolvemos serviços Yandex Cloud respondendo às solicitações de nossos clientes e, às vezes, até antecipando-as. Muitos de nossos clientes hoje usam o Yandex SpeechKit para criar assistentes de voz com uma interface de conversação. Nesses projetos, é importante tornar o texto de máquina reconhecido o mais próximo possível de como um interlocutor real o escreveria. O Punctuator resolve esse problema de forma simples”, disse Vasily Ershov, chefe de desenvolvimento do Yandex SpeechKit.

avalanche

Postagens recentes

A SpaceX pretende transformar a Starlink em uma operadora de telefonia móvel e desafiar as três maiores empresas dos EUA.

Tecnicamente, os clientes da T-Mobile nos EUA já podem se conectar diretamente aos satélites Starlink…

17 minutos atrás

A Swatch exigiu da Samsung uma indenização de 170 milhões de dólares por copiar o design dos mostradores de seus relógios inteligentes.

Como a prática demonstra, até mesmo o formato de um retângulo com cantos arredondados pode…

53 minutos atrás

Cientistas criaram um pixel que ensinará as telas a enxergar.

Para diversas aplicações, seria tentador combinar as funções de tela e câmera em uma única…

53 minutos atrás

Kingdom Come: Deliverance 2 atinge novo pico de vendas e recebe uma missão com o “bobo da corte excêntrico” de Balatro.

A editora Deep Silver e os desenvolvedores da Warhorse Studios, da República Tcheca, comemoraram as…

1 hora atrás

A Microsoft corrigiu diversos problemas de Bluetooth no Windows 11 e melhorou a experiência com os AirPods da Apple.

A Microsoft lançou a maior atualização de recursos Bluetooth até o momento para o Windows…

1 hora atrás

A Chuwi começou a aceitar pré-encomendas para o laptop UniBook com processador Intel Wildcat Lake e preço inicial de US$ 449.

A Chuwi anunciou a pré-venda do notebook UniBook, equipado com o novo processador Intel Core…

1 hora atrás