Nos últimos anos, as redes neurais generativas superaram um importante estágio de desenvolvimento, tornando-se mais poderosas e capazes de criar não apenas imagens, mas também vídeos baseados em descrições de texto. O novo algoritmo VASA-1 da Microsoft provavelmente surpreenderá muitos porque não requer nenhuma descrição para funcionar. Basta fornecer uma imagem de uma pessoa e uma trilha de áudio, a partir da qual a rede neural gerará um vídeo de uma pessoa falante com uma ampla gama de emoções e expressões faciais naturais.
Fonte da imagem: Microsoft
O resultado do VASA-1 parece muito natural e verossímil. A partir de apenas uma foto de um rosto e uma gravação de voz, o algoritmo cria um vídeo realista em que a pessoa capturada na foto literalmente “ganha vida” e suas expressões faciais, movimentos de lábios e cabeça parecem completamente naturais. Como os vídeos criados com o VASA-1 são difíceis de distinguir imediatamente dos reais, já existem preocupações de que o algoritmo possa ser usado por invasores para criar falsificações.
Quanto à própria rede neural, seu principal diferencial em relação a outros algoritmos semelhantes é a presença de um modelo holístico para geração de expressões faciais e movimentos de cabeça. A Microsoft conduziu uma extensa pesquisa, incluindo a avaliação de uma série de novas métricas. Como resultado, eles descobriram que o novo algoritmo supera significativamente os análogos apresentados anteriormente em muitos aspectos.
«Nosso método não apenas gera vídeo de alta qualidade com expressões faciais e movimentos de cabeça realistas, mas também suporta a geração de vídeo online de 512×512 pixels a 40 quadros por segundo com atraso inicial insignificante. Isso abre caminho para interações em tempo real com avatares realistas que imitam o comportamento conversacional humano”, afirmou a Microsoft em comunicado.
Em outras palavras, a rede neural pode criar vídeos falsos de alta qualidade baseados em apenas uma imagem. Portanto, não é surpreendente que a Microsoft chame o VASA-1 de “demonstração de pesquisa” e não tenha planos de trazê-lo ao mercado comercial, pelo menos não tão cedo.
Os criadores do Trojan VoidStealer descobriram uma maneira de burlar a criptografia vinculada a aplicativos…
Documentos judiciais revelaram esta semana que, em 2017, Elon Musk esperava obter o controle da…
Os smartphones Android de gama média apresentaram progressos significativos nos últimos anos, mas ainda não…
Era inevitável que isso acontecesse um dia. Pela primeira vez, um robô humanoide foi apresentado…
Operadoras de telecomunicações russas alertaram novamente os moradores de Moscou sobre possíveis restrições à internet…
O rover Curiosity da NASA se deparou com uma situação incomum durante uma perfuração de…