O modelo DragGAN AI é capaz de virar a cabeça e mudar as poses de pessoas e animais na foto, como se fosse em 3D

Pesquisadores do Instituto Max Planck revelaram o modelo DragGAN AI, que permite a manipulação de imagens quase em tempo real. A ferramenta é semelhante ao recurso Warp do Photoshop, mas muito mais poderosa, pois o usuário não apenas move pixels, mas usa inteligência artificial para recriar o objeto subjacente. Além disso, permite girar as imagens como se fossem 3D.

Fonte da imagem: arxiv.org / Arraste seu GAN

DragGAN pode não apenas redimensionar um objeto em uma imagem ou transformar um sorriso em uma carranca com um simples clique do mouse, mas também girá-lo como se fosse um modelo 3D. Por exemplo, você pode alterar a direção do rosto de uma pessoa. Os vídeos abaixo são do site da equipe de pesquisa. O texto completo do trabalho de pesquisa pode ser lido no site arXiv.

Como aponta a equipe de desenvolvimento, o que é realmente interessante neste trabalho não é a manipulação de imagens em si, mas a interface do usuário. Há muito tempo conseguimos usar ferramentas de IA como GANs para criar imagens realistas, mas a maioria dos métodos carece de flexibilidade e precisão. Você pode dizer ao gerador de imagens AI “faça uma foto de um leão observando a savana” e você conseguirá, mas o leão pode não estar exatamente na posição que você deseja.

DragGAN oferece uma solução para este problema. A interface é exatamente a mesma dos editores de imagem tradicionais, mas em vez de apenas manchar os pixels existentes, o modelo recria o objeto. Os pesquisadores escrevem: “Nossa abordagem pode não apenas criar oclusão de objetos, mas também deformá-los de acordo com a rigidez, por exemplo, ao dobrar a perna de um cavalo”.

Embora esta seja apenas uma demonstração e não aprecie totalmente a tecnologia, é outro exemplo de como tornar a manipulação de imagem assistida por IA mais acessível.

avalanche

Postagens recentes

Headset de realidade mista da Apple custa mais de US$ 1.500

Segundo rumores, já no início de junho, a Apple apresentará seu tão esperado headset de…

2 minutos atrás

Samsung mudou de ideia sobre mudar busca do Google para o Bing em seus aparelhos

A Samsung parou de explorar a possibilidade de mudar o mecanismo de busca padrão em…

18 minutos atrás

NVIDIA oferecerá placas gráficas 460 GeForce RTX 4060 e RTX 4060 Ti em seu lançamento

A NVIDIA lançou uma das maiores promoções de distribuição de placas de vídeo de todos…

37 minutos atrás

Microsoft Game Pass pode introduzir visualização de anúncios em troca de acesso uma assinatura

Desde o seu lançamento em 2017, o serviço de assinatura do Xbox Game Pass atraiu…

38 minutos atrás

“Yandex” abriu em Moscou o centro de desenvolvimento de robôs de armazém

«Yandex anunciou o lançamento de um centro de criação de robôs de armazém para Yandex.Market.…

58 minutos atrás

CAPSTONE cubesat testou com sucesso tecnologia para GPS lunar e fotografou a Lua

O minissatélite CAPSTONE da NASA, orbitando a Lua, testou com sucesso a tecnologia de navegação…

1 hora atrás