Os pesquisadores do Google desenvolveram o VLOGGER, uma nova IA que cria vídeos realistas de pessoas conversando, movendo-se e gesticulando a partir de uma única foto. Além da fotografia, você pode adicionar uma trilha de áudio, a partir da qual a IA criará um pequeno vídeo de uma pessoa falando com expressões faciais e gestos apropriados.

Fonte da imagem: everypixel.com

«Ao contrário dos trabalhos anteriores, nosso modelo não requer treinamento separado para cada foto e trabalha não apenas com rostos, criando uma imagem completa de uma pessoa, não apenas com o rosto ou lábios, o que abre novas oportunidades necessárias para recriar corretamente pessoas que se comunicam, ” eles comentaram sobre o desenvolvimento dos pesquisadores do Google.

O desenvolvimento do Google pode ser aplicado em diversas áreas da atividade humana, uma das quais é a criação de avatares fotorrealistas tridimensionais para jogos e realidade virtual. Talvez alguns atores queiram se digitalizar e vender modelos 3D para estúdios de cinema. Uma das principais aplicações da tecnologia do Google é a criação de chatbots realistas que podem ser comunicados como se fossem pessoas reais.

«O VLOGGER pode ser usado como solução para apresentações, programas de treinamento, comunicação em redes de baixa largura de banda, como narrador virtual ou como interface para comunicação de texto humano-computador”, afirmam os pesquisadores.

Fonte da imagem: enriccorona.github.io

Igualmente óbvio é o uso potencial da tecnologia para criar deepfakes, cuja popularidade crescente tem preocupado legisladores e especialistas em segurança em todo o mundo.

«Nosso modelo proposto é superior a outros desenvolvimentos modernos em termos de qualidade de imagem, preservação da identidade humana e consistência temporal”, observaram os pesquisadores.

Atualmente, o VLOGGER apresenta desvantagens objetivas: os vídeos são bastante curtos, o fundo é estático, as pessoas não se movem no espaço, suas expressões faciais e fala, embora bastante realistas, ainda denunciam o trabalho da IA. No entanto, há um salto notável na tecnologia de animação de imagens.

avalanche

Postagens recentes

Líder de Engenharia do Apple Vision Pro se junta à OpenAI

A colaboração da startup de IA OpenAI com ex-funcionários da Apple no desenvolvimento de dispositivos…

24 minutos atrás

As ações da SpaceX serão adicionadas ao índice Nasdaq 100 em um cronograma acelerado, ampliando o acesso para os investidores.

A Russell, gestora de índices de ações, confirmou ontem que as ações da SpaceX serão…

1 hora atrás

A Anthropic recebeu autorização para restaurar o acesso ao Mythos 5 para alguns clientes.

Há algumas semanas, as autoridades americanas ordenaram que cidadãos estrangeiros bloqueassem o acesso aos modelos…

2 horas atrás

A China dobrará o tamanho de sua estação orbital Tiangong nos próximos anos e lançará um telescópio da classe Hubble.

A China planeja expandir sua estação espacial Tiangong de três para seis módulos nos próximos…

7 horas atrás

Chamado dos Deuses Anciãos – O Conforto do Desconhecido. Resenha

Jogado no PC Call of the Sea foi uma estreia vibrante para a Out of…

8 horas atrás