O modelo DragGAN AI é capaz de virar a cabeça e mudar as poses de pessoas e animais na foto, como se fosse em 3D

Pesquisadores do Instituto Max Planck revelaram o modelo DragGAN AI, que permite a manipulação de imagens quase em tempo real. A ferramenta é semelhante ao recurso Warp do Photoshop, mas muito mais poderosa, pois o usuário não apenas move pixels, mas usa inteligência artificial para recriar o objeto subjacente. Além disso, permite girar as imagens como se fossem 3D.

Fonte da imagem: arxiv.org / Arraste seu GAN

DragGAN pode não apenas redimensionar um objeto em uma imagem ou transformar um sorriso em uma carranca com um simples clique do mouse, mas também girá-lo como se fosse um modelo 3D. Por exemplo, você pode alterar a direção do rosto de uma pessoa. Os vídeos abaixo são do site da equipe de pesquisa. O texto completo do trabalho de pesquisa pode ser lido no site arXiv.

Como aponta a equipe de desenvolvimento, o que é realmente interessante neste trabalho não é a manipulação de imagens em si, mas a interface do usuário. Há muito tempo conseguimos usar ferramentas de IA como GANs para criar imagens realistas, mas a maioria dos métodos carece de flexibilidade e precisão. Você pode dizer ao gerador de imagens AI “faça uma foto de um leão observando a savana” e você conseguirá, mas o leão pode não estar exatamente na posição que você deseja.

DragGAN oferece uma solução para este problema. A interface é exatamente a mesma dos editores de imagem tradicionais, mas em vez de apenas manchar os pixels existentes, o modelo recria o objeto. Os pesquisadores escrevem: “Nossa abordagem pode não apenas criar oclusão de objetos, mas também deformá-los de acordo com a rigidez, por exemplo, ao dobrar a perna de um cavalo”.

Embora esta seja apenas uma demonstração e não aprecie totalmente a tecnologia, é outro exemplo de como tornar a manipulação de imagem assistida por IA mais acessível.

avalanche

Postagens recentes

A Nvidia promete acelerar o ray tracing e o path tracing em um milhão de vezes em futuras GPUs.

Apesar da crescente concorrência da Intel e da AMD, a linha de placas gráficas RTX…

27 minutos atrás

Foi introduzida uma nova geração de blocos de água para IA, capazes de resfriar toda a placa simultaneamente.

Essencialmente, os aceleradores de IA mais avançados estão refrigerando sistemas de refrigeração líquida obsoletos. É…

38 minutos atrás

A Microsoft confirmou quando seu assistente de IA, o Gaming Copilot, chegará ao Xbox Series X e S.

Após o Windows 11, os dispositivos móveis e o ROG Xbox Ally, o assistente de…

2 horas atrás

A construção do maior cabo submarino de internet do mundo, o Meta 2Africa, foi suspensa devido às tensões no Oriente Médio.

O projeto 2Africa da Meta✴ — o sistema de cabos submarinos de acesso aberto mais…

2 horas atrás

Na China, foi criado um robô vestível que transforma humanos em centauros e ajuda a carregar cargas.

Engenheiros chineses da Universidade de Ciência e Tecnologia do Sul, em Shenzhen, desenvolveram um robô…

3 horas atrás

Como abastecer um tanque: a BYD apresentou um carro elétrico que carrega em 12 minutos.

No ano passado, a montadora chinesa BYD ultrapassou a Tesla e se tornou a maior…

3 horas atrás