O YouTube está testando uma tecnologia de inteligência artificial (IA) projetada para sincronizar os movimentos labiais dos falantes durante a tradução automática. Este desenvolvimento complementa o recurso de voz automática existente, que já utiliza IA para traduzir áudio.
De acordo com Buddhika Kottahachchi, chefe de produto de voz automática, a equipe teve que desenvolver ferramentas capazes de “modificar pixels na tela para corresponder à fala traduzida”. Para isso, o sistema analisa não apenas o formato dos lábios, mas também a posição dos dentes, expressões faciais, postura e outros parâmetros visuais. De acordo com a PCMag, na atual fase de testes, a tecnologia demonstrou os melhores resultados em vídeo Full HD. Seu desempenho é inferior em 4K, mas a qualidade pode ser melhorada até o lançamento oficial.
Como lembrete, o YouTube demonstrou o recurso pela primeira vez em um evento em setembro, mas a data de lançamento público ainda não foi anunciada. A versão inicial da ferramenta suporta sincronização labial para tradução para inglês, francês, alemão, espanhol e português. Os planos futuros incluem a expansão da cobertura para todos os idiomas suportados pelo sistema de duplicação automática, incluindo bengali, holandês, hebraico, hindi, indonésio, italiano, japonês, coreano, malaiala (uma língua dravídica), polonês, punjabi, romeno, russo, tâmil, télugo, turco, ucraniano e vietnamita. O preço deste recurso não foi divulgado.
Este recurso está atualmente em fase inicial de testes e o acesso é limitado a usuários selecionados da plataforma.
A Open Compute Project Foundation (OCP) anunciou a expansão da sua chamada "Open Chiplet Economy".…
A Oracle anunciou o cluster de IA baseado em nuvem OCI Zettascale10, alimentado por centenas…
A empresa italiana Gevi Wind desenvolveu um sistema alimentado por IA para ajustar o ângulo…
A 5CA, provedora de suporte ao cliente da plataforma Discord, negou ter sido hackeada, refutando…
A Oracle Cloud Infrastructure anunciou esta semana planos para implantar 50.000 aceleradores gráficos AMD para…
O Google Meet finalmente tem um filtro de maquiagem com tecnologia de IA para usuários…