O YouTube aprenderá a sincronizar a dublagem automática com os lábios do locutor.

O YouTube está testando uma tecnologia de inteligência artificial (IA) projetada para sincronizar os movimentos labiais dos falantes durante a tradução automática. Este desenvolvimento complementa o recurso de voz automática existente, que já utiliza IA para traduzir áudio.

De acordo com Buddhika Kottahachchi, chefe de produto de voz automática, a equipe teve que desenvolver ferramentas capazes de “modificar pixels na tela para corresponder à fala traduzida”. Para isso, o sistema analisa não apenas o formato dos lábios, mas também a posição dos dentes, expressões faciais, postura e outros parâmetros visuais. De acordo com a PCMag, na atual fase de testes, a tecnologia demonstrou os melhores resultados em vídeo Full HD. Seu desempenho é inferior em 4K, mas a qualidade pode ser melhorada até o lançamento oficial.

Como lembrete, o YouTube demonstrou o recurso pela primeira vez em um evento em setembro, mas a data de lançamento público ainda não foi anunciada. A versão inicial da ferramenta suporta sincronização labial para tradução para inglês, francês, alemão, espanhol e português. Os planos futuros incluem a expansão da cobertura para todos os idiomas suportados pelo sistema de duplicação automática, incluindo bengali, holandês, hebraico, hindi, indonésio, italiano, japonês, coreano, malaiala (uma língua dravídica), polonês, punjabi, romeno, russo, tâmil, télugo, turco, ucraniano e vietnamita. O preço deste recurso não foi divulgado.

Este recurso está atualmente em fase inicial de testes e o acesso é limitado a usuários selecionados da plataforma.

admin

Postagens recentes

A nova temporada de Warface, “Steel Quarters”, promete: brutalidade em todas as pistas de patinação!

Warface vem encantando fãs de ação online há quase quatorze anos, e a temporada "Steel…

43 minutos atrás

O SoftBank tomou emprestado US$ 40 bilhões por um ano para investir na OpenAI.

O SoftBank Group, holding multinacional japonesa e um dos maiores investidores mundiais no setor de…

2 horas atrás

A Meta construirá sete usinas termelétricas a gás com capacidade total de 5,2 GW para acompanhar a corrida da IA.

Segundo a Bloomberg, a Meta✴ financiará a construção de sete novas usinas termelétricas a gás…

2 horas atrás

“Mandem-me para o futuro para que eu possa jogar este jogo”: Novas imagens de jogabilidade do RPG de ação no estilo Mass Effect, Exodus, deixam os fãs empolgados.

A Archetype Entertainment, veterana da BioWare, divulgou novas imagens de jogabilidade de Exodus, seu ambicioso…

2 horas atrás

Uma vulnerabilidade zero-day perigosa foi descoberta no Telegram, mas os detalhes estão sendo mantidos em segredo.

Michael Deplante, especialista em segurança da informação associado à Zero Day Initiative da TrendAI, descobriu…

2 horas atrás

“Não quer aceleradores? Pelo menos leve a rede!” A NVIDIA abriu seus racks de IA para chips de terceiros.

A NVIDIA começou a desenvolver racks de servidores adequados para soluções baseadas em aceleradores de…

4 horas atrás