Os cientistas há muito descrevem a profissão de tradutor como moribunda, já que o desenvolvimento de sistemas de tradução automática a colocou em risco de existência por mais de uma década consecutiva. O Google conseguiu levar a tecnologia a um novo patamar: a inteligência artificial agora é capaz não só de traduzir a fala de uma pessoa gravada em vídeo, mas também de adaptar sua articulação ao resultado da tradução para outro idioma.
Em outras palavras, os movimentos dos lábios de uma pessoa serão sincronizados com as palavras que ela supostamente pronuncia em outro idioma. O trabalho do “tradutor universal”, como o Google simplesmente chamou essa tecnologia, consiste em várias etapas. Primeiro, o sistema reconhece a fala da pessoa que fala no vídeo “de ouvido” e a traduz em forma de texto. Este texto já está sendo traduzido para o idioma desejado, a fala é imediatamente sintetizada a partir dele, mantendo o timbre e o colorido emocional do original. Então, sob um novo discurso em outro idioma, não apenas os movimentos dos lábios e expressões faciais, mas também os gestos do falante são sincronizados. O vídeo final parece que o orador estava originalmente falando em um idioma diferente, o que ele não fez.
Essa tecnologia abre grandes oportunidades, se não no cinema, onde a dublagem continua sendo um processo complexo, pelo menos no campo da educação. Como o Google teme com razão, tal ferramenta deve, mais cedo ou mais tarde, interessar a invasores que, com sua ajuda, desejarão falsificar as declarações públicas dos mesmos políticos, por exemplo. Por esse motivo, a corporação pretende não apenas distribuir a tecnologia de “tradução universal” por meio de parceiros confiáveis, mas também dotar os vídeos resultantes de vários tipos de marcas d’água que permitam ao espectador entender que o vídeo é um produto de inteligência artificial.