O modelo DragGAN AI é capaz de virar a cabeça e mudar as poses de pessoas e animais na foto, como se fosse em 3D

Pesquisadores do Instituto Max Planck revelaram o modelo DragGAN AI, que permite a manipulação de imagens quase em tempo real. A ferramenta é semelhante ao recurso Warp do Photoshop, mas muito mais poderosa, pois o usuário não apenas move pixels, mas usa inteligência artificial para recriar o objeto subjacente. Além disso, permite girar as imagens como se fossem 3D.

Fonte da imagem: arxiv.org / Arraste seu GAN

DragGAN pode não apenas redimensionar um objeto em uma imagem ou transformar um sorriso em uma carranca com um simples clique do mouse, mas também girá-lo como se fosse um modelo 3D. Por exemplo, você pode alterar a direção do rosto de uma pessoa. Os vídeos abaixo são do site da equipe de pesquisa. O texto completo do trabalho de pesquisa pode ser lido no site arXiv.

Como aponta a equipe de desenvolvimento, o que é realmente interessante neste trabalho não é a manipulação de imagens em si, mas a interface do usuário. Há muito tempo conseguimos usar ferramentas de IA como GANs para criar imagens realistas, mas a maioria dos métodos carece de flexibilidade e precisão. Você pode dizer ao gerador de imagens AI “faça uma foto de um leão observando a savana” e você conseguirá, mas o leão pode não estar exatamente na posição que você deseja.

DragGAN oferece uma solução para este problema. A interface é exatamente a mesma dos editores de imagem tradicionais, mas em vez de apenas manchar os pixels existentes, o modelo recria o objeto. Os pesquisadores escrevem: “Nossa abordagem pode não apenas criar oclusão de objetos, mas também deformá-los de acordo com a rigidez, por exemplo, ao dobrar a perna de um cavalo”.

Embora esta seja apenas uma demonstração e não aprecie totalmente a tecnologia, é outro exemplo de como tornar a manipulação de imagem assistida por IA mais acessível.

avalanche

Postagens recentes

Estudo: 9 em cada 10 dicas financeiras de blogueiros foram consideradas ruins – mas as pessoas ainda ficaram satisfeitas.

Segundo um estudo realizado no Reino Unido, os conselhos de influenciadores financeiros nas redes sociais…

58 minutos atrás

Agora você pode programar em qualquer lugar: o ChatGPT para smartphones agora tem o Codex.

A OpenAI aprimorou o aplicativo móvel ChatGPT para desenvolvedores que trabalham em qualquer lugar, adicionando…

58 minutos atrás

A Samsung iniciou cortes emergenciais na produção em antecipação a uma greve em massa.

A Samsung Electronics está se preparando para uma greve geral de 18 dias, planejada pelos…

58 minutos atrás

A Cerebras realizou o maior IPO deste ano, com as ações da concorrente da Nvidia disparando 68% no primeiro dia.

As ações da Cerebras Systems, que começaram a ser negociadas ontem na bolsa Nasdaq, fecharam…

1 hora atrás

A Hobot lançou o robô de limpeza de janelas Hobot SP10, equipado com raspadores móveis para resultados impecáveis.

A HOBOT lançou o robô de limpeza de janelas Hobot SP10, o primeiro do setor…

1 hora atrás

A JCB apresenta o Hydromax, um caminhão de corrida movido a hidrogênio com 1.200 cavalos de potência, projetado para quebrar recordes.

Recentemente, a empresa britânica JCB apresentou o Hydromax, um veículo de alta velocidade movido a…

1 hora atrás