A equipe de desenvolvimento do Yandex anunciou as próximas melhorias na tecnologia para tradução fora da tela de vídeos em idiomas estrangeiros e a inclusão do suporte para tradução simultânea usando 12 vozes – seis masculinas e seis femininas.
Fonte da imagem: Yandex
O sistema de locução é integrado ao Yandex.Browser e faz pleno uso de tecnologias de aprendizado de máquina e inteligência artificial baseadas em redes neurais.
Para reconhecer diferentes falantes no vídeo, duas redes neurais são usadas: primeiro, uma delas traduz a fala em texto, restaura a pontuação e determina os limites das frases, depois a segunda analisa o espectrograma da voz e marca fragmentos falados por diferentes pessoas no vídeo. a faixa de áudio. Assim, fica claro qual dos palestrantes disse o quê, e fica muito mais fácil perceber a tradução de um vídeo com grande número de caracteres.
«Estamos constantemente trabalhando na qualidade da tradução e dublagem para dar aos nossos usuários acesso a qualquer conteúdo de todo o mundo. De acordo com nossas estimativas, cerca de metade dos vídeos do YouTube em idiomas estrangeiros são vídeos com três ou mais falantes. Não é muito conveniente assisti-los com dublagem de duas vozes – é por isso que fizemos dez novas vozes ”, dizem eles no Yandex.
Atualmente, o sistema de voz Yandex suporta inglês, francês, alemão, espanhol e italiano. A empresa planeja adicionar novos pares de idiomas e expandir a funcionalidade do produto.
A Russell, gestora de índices de ações, confirmou ontem que as ações da SpaceX serão…
Há algumas semanas, as autoridades americanas ordenaram que cidadãos estrangeiros bloqueassem o acesso aos modelos…
A China planeja expandir sua estação espacial Tiangong de três para seis módulos nos próximos…
Jogado no PC Call of the Sea foi uma estreia vibrante para a Out of…
A IGN lançou uma demonstração exclusiva de jogabilidade de Assassin's Creed Black Flag Resynced, o…
A OpenAI apresentou oficialmente sua família de modelos de linguagem GPT-5.6, que inclui três modelos…