Google introduziu a tecnologia de dublagem automática de vídeo com tradução e articulação de desenho

Os cientistas há muito descrevem a profissão de tradutor como moribunda, já que o desenvolvimento de sistemas de tradução automática a colocou em risco de existência por mais de uma década consecutiva. O Google conseguiu levar a tecnologia a um novo patamar: a inteligência artificial agora é capaz não só de traduzir a fala de uma pessoa gravada em vídeo, mas também de adaptar sua articulação ao resultado da tradução para outro idioma.

Fonte da imagem: Google

Em outras palavras, os movimentos dos lábios de uma pessoa serão sincronizados com as palavras que ela supostamente pronuncia em outro idioma. O trabalho do “tradutor universal”, como o Google simplesmente chamou essa tecnologia, consiste em várias etapas. Primeiro, o sistema reconhece a fala da pessoa que fala no vídeo “de ouvido” e a traduz em forma de texto. Este texto já está sendo traduzido para o idioma desejado, a fala é imediatamente sintetizada a partir dele, mantendo o timbre e o colorido emocional do original. Então, sob um novo discurso em outro idioma, não apenas os movimentos dos lábios e expressões faciais, mas também os gestos do falante são sincronizados. O vídeo final parece que o orador estava originalmente falando em um idioma diferente, o que ele não fez.

Essa tecnologia abre grandes oportunidades, se não no cinema, onde a dublagem continua sendo um processo complexo, pelo menos no campo da educação. Como o Google teme com razão, tal ferramenta deve, mais cedo ou mais tarde, interessar a invasores que, com sua ajuda, desejarão falsificar as declarações públicas dos mesmos políticos, por exemplo. Por esse motivo, a corporação pretende não apenas distribuir a tecnologia de “tradução universal” por meio de parceiros confiáveis, mas também dotar os vídeos resultantes de vários tipos de marcas d’água que permitam ao espectador entender que o vídeo é um produto de inteligência artificial.

avalanche

Postagens recentes

A OpenAI Frontier, uma plataforma que permite aos usuários corporativos gerenciar agentes de IA, foi lançada.

O mercado de IA empresarial está se monetizando mais rapidamente, por isso a OpenAI direcionou…

2 horas atrás

O serviço de jogos em nuvem GeForce Now tem seis anos, mas na verdade é muito mais antigo.

A Nvidia está comemorando o sexto aniversário de sua plataforma de jogos em nuvem GeForce…

7 horas atrás

Correção Quântica: Em Busca do Exponencial / Offsyanka

No final de 2025, o presidente dos EUA, Donald Trump, expressou sua intenção de fornecer…

7 horas atrás

O Google em breve ensinará os smartphones Android a enviar arquivos diretamente para iPhones via AirDrop.

O Google expandirá em breve significativamente o suporte ao compartilhamento de arquivos entre dispositivos Android…

7 horas atrás

A Anthropic apresentou o Claude Opus 4.6, seu principal LLM com equipes de agentes, milhões de contextos e acesso pago.

A Anthropic apresentou uma nova versão de seu principal modelo de linguagem, o Claude Opus…

8 horas atrás

Suporte exemplar: a Noctua “revitalizou” meio milhão de coolers — até mesmo um modelo de 17 anos agora possui uma montagem AM5.

A Noctua é conhecida não apenas por seus coolers e ventoinhas marrom-bege, mas também por…

8 horas atrás