Os desenvolvedores da plataforma de nuvem Yandex Cloud atualizaram o serviço Yandex SpeechKit construído com base no aprendizado de máquina, projetado para síntese e reconhecimento de fala. Agora, ao traduzir voz em texto, o serviço adiciona automaticamente sinais de pontuação nos lugares certos.
Fonte da imagem: Reuters
O novo recurso é chamado de “Pontuador”. Funciona tanto no reconhecimento de fala online para cenários com assistentes de voz, quanto no processamento de arquivos de áudio pré-gravados. O novo recurso é baseado em dois modelos consecutivos de aprendizado de máquina. O primeiro traduz a voz em texto e o segundo coloca os sinais de pontuação de acordo com as normas da língua russa. Atualmente, a função mencionada lida com o arranjo dos principais sinais de pontuação do idioma russo. Todos os usuários do Yandex SpeechKit podem interagir com o Pontuador.
Os desenvolvedores estão confiantes de que a inovação melhorará a experiência do usuário em cenários que envolvem uma pessoa interagindo diretamente com tecnologias de fala. Em primeiro lugar, estamos falando de trabalhar com assistentes de voz, transcrição automática e formação de legendas. Nota-se que o texto reconhecido pela rede neural é o mais próximo possível do literário.
«Desenvolvemos serviços Yandex Cloud respondendo às solicitações de nossos clientes e, às vezes, até antecipando-as. Muitos de nossos clientes hoje usam o Yandex SpeechKit para criar assistentes de voz com uma interface de conversação. Nesses projetos, é importante tornar o texto de máquina reconhecido o mais próximo possível de como um interlocutor real o escreveria. O Punctuator resolve esse problema de forma simples”, disse Vasily Ershov, chefe de desenvolvimento do Yandex SpeechKit.
Os desenvolvedores do estúdio polonês Techland apresentaram os requisitos completos do sistema do jogo de…
A Jaguar Land Rover (JLR) afirmou que a violação "interrompeu gravemente" suas operações de varejo…
Os Estados Unidos revogaram a permissão da Taiwan Semiconductor Manufacturing Co. de fornecer livremente equipamentos…
A Thermalright apresentou seu principal cooler para CPU, o Phantom Spirit 120 Digital. O novo…
A tão aguardada entrada da Tesla no mercado indiano ficou aquém das expectativas até agora,…
Dez anos após o lançamento do formato Dolby Vision, uma versão atualizada do padrão, o…