Pesquisadores do Instituto Max Planck revelaram o modelo DragGAN AI, que permite a manipulação de imagens quase em tempo real. A ferramenta é semelhante ao recurso Warp do Photoshop, mas muito mais poderosa, pois o usuário não apenas move pixels, mas usa inteligência artificial para recriar o objeto subjacente. Além disso, permite girar as imagens como se fossem 3D.

Fonte da imagem: arxiv.org / Arraste seu GAN

DragGAN pode não apenas redimensionar um objeto em uma imagem ou transformar um sorriso em uma carranca com um simples clique do mouse, mas também girá-lo como se fosse um modelo 3D. Por exemplo, você pode alterar a direção do rosto de uma pessoa. Os vídeos abaixo são do site da equipe de pesquisa. O texto completo do trabalho de pesquisa pode ser lido no site arXiv.

Como aponta a equipe de desenvolvimento, o que é realmente interessante neste trabalho não é a manipulação de imagens em si, mas a interface do usuário. Há muito tempo conseguimos usar ferramentas de IA como GANs para criar imagens realistas, mas a maioria dos métodos carece de flexibilidade e precisão. Você pode dizer ao gerador de imagens AI “faça uma foto de um leão observando a savana” e você conseguirá, mas o leão pode não estar exatamente na posição que você deseja.

DragGAN oferece uma solução para este problema. A interface é exatamente a mesma dos editores de imagem tradicionais, mas em vez de apenas manchar os pixels existentes, o modelo recria o objeto. Os pesquisadores escrevem: “Nossa abordagem pode não apenas criar oclusão de objetos, mas também deformá-los de acordo com a rigidez, por exemplo, ao dobrar a perna de um cavalo”.

Embora esta seja apenas uma demonstração e não aprecie totalmente a tecnologia, é outro exemplo de como tornar a manipulação de imagem assistida por IA mais acessível.

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *