Os pesquisadores do Google desenvolveram o VLOGGER, uma nova IA que cria vídeos realistas de pessoas conversando, movendo-se e gesticulando a partir de uma única foto. Além da fotografia, você pode adicionar uma trilha de áudio, a partir da qual a IA criará um pequeno vídeo de uma pessoa falando com expressões faciais e gestos apropriados.
«Ao contrário dos trabalhos anteriores, nosso modelo não requer treinamento separado para cada foto e trabalha não apenas com rostos, criando uma imagem completa de uma pessoa, não apenas com o rosto ou lábios, o que abre novas oportunidades necessárias para recriar corretamente pessoas que se comunicam, ” eles comentaram sobre o desenvolvimento dos pesquisadores do Google.
O desenvolvimento do Google pode ser aplicado em diversas áreas da atividade humana, uma das quais é a criação de avatares fotorrealistas tridimensionais para jogos e realidade virtual. Talvez alguns atores queiram se digitalizar e vender modelos 3D para estúdios de cinema. Uma das principais aplicações da tecnologia do Google é a criação de chatbots realistas que podem ser comunicados como se fossem pessoas reais.
«O VLOGGER pode ser usado como solução para apresentações, programas de treinamento, comunicação em redes de baixa largura de banda, como narrador virtual ou como interface para comunicação de texto humano-computador”, afirmam os pesquisadores.
Igualmente óbvio é o uso potencial da tecnologia para criar deepfakes, cuja popularidade crescente tem preocupado legisladores e especialistas em segurança em todo o mundo.
«Nosso modelo proposto é superior a outros desenvolvimentos modernos em termos de qualidade de imagem, preservação da identidade humana e consistência temporal”, observaram os pesquisadores.
Atualmente, o VLOGGER apresenta desvantagens objetivas: os vídeos são bastante curtos, o fundo é estático, as pessoas não se movem no espaço, suas expressões faciais e fala, embora bastante realistas, ainda denunciam o trabalho da IA. No entanto, há um salto notável na tecnologia de animação de imagens.