O YouTube aprenderá a sincronizar a dublagem automática com os lábios do locutor.

O YouTube está testando uma tecnologia de inteligência artificial (IA) projetada para sincronizar os movimentos labiais dos falantes durante a tradução automática. Este desenvolvimento complementa o recurso de voz automática existente, que já utiliza IA para traduzir áudio.

De acordo com Buddhika Kottahachchi, chefe de produto de voz automática, a equipe teve que desenvolver ferramentas capazes de “modificar pixels na tela para corresponder à fala traduzida”. Para isso, o sistema analisa não apenas o formato dos lábios, mas também a posição dos dentes, expressões faciais, postura e outros parâmetros visuais. De acordo com a PCMag, na atual fase de testes, a tecnologia demonstrou os melhores resultados em vídeo Full HD. Seu desempenho é inferior em 4K, mas a qualidade pode ser melhorada até o lançamento oficial.

Como lembrete, o YouTube demonstrou o recurso pela primeira vez em um evento em setembro, mas a data de lançamento público ainda não foi anunciada. A versão inicial da ferramenta suporta sincronização labial para tradução para inglês, francês, alemão, espanhol e português. Os planos futuros incluem a expansão da cobertura para todos os idiomas suportados pelo sistema de duplicação automática, incluindo bengali, holandês, hebraico, hindi, indonésio, italiano, japonês, coreano, malaiala (uma língua dravídica), polonês, punjabi, romeno, russo, tâmil, télugo, turco, ucraniano e vietnamita. O preço deste recurso não foi divulgado.

Este recurso está atualmente em fase inicial de testes e o acesso é limitado a usuários selecionados da plataforma.

admin

Postagens recentes

O segundo centro de dados da Wildberries foi inaugurado em Dubna.

A RWB, mais conhecida por seu marketplace Wildberries, inaugurou seu segundo data center na região…

1 hora atrás

Colliers: O investimento em data centers superou o investimento no setor petrolífero pela primeira vez, mas os riscos permanecem.

Segundo a Colliers, o investimento global em data centers ultrapassará US$ 580 bilhões em 2025,…

1 hora atrás

O Telegram agora possui um recurso de IA para reescrever mensagens.

A versão beta do Telegram agora conta com o Editor de IA, um editor de…

1 hora atrás

O campo magnético da Terra protege a Lua da radiação, mas não todos os dias.

Graças aos sensores de radiação da sonda lunar chinesa Chang'e-4, descobriu-se que, ao contrário da…

1 hora atrás

Philips revela o monitor gamer Evnia 32M2N8900X de 31,5 polegadas — QD-OLED, 4K, 240Hz e Ambiglow.

A Philips apresentou o monitor gamer Evnia 32M2N8900X de 31,5 polegadas. Ele possui um painel…

1 hora atrás

O Yandex Maps aprendeu a fornecer conselhos usando inteligência artificial.

A Yandex anunciou um novo recurso de IA para o Yandex Maps que ajudará você…

1 hora atrás