O modelo DragGAN AI é capaz de virar a cabeça e mudar as poses de pessoas e animais na foto, como se fosse em 3D

Pesquisadores do Instituto Max Planck revelaram o modelo DragGAN AI, que permite a manipulação de imagens quase em tempo real. A ferramenta é semelhante ao recurso Warp do Photoshop, mas muito mais poderosa, pois o usuário não apenas move pixels, mas usa inteligência artificial para recriar o objeto subjacente. Além disso, permite girar as imagens como se fossem 3D.

Fonte da imagem: arxiv.org / Arraste seu GAN

DragGAN pode não apenas redimensionar um objeto em uma imagem ou transformar um sorriso em uma carranca com um simples clique do mouse, mas também girá-lo como se fosse um modelo 3D. Por exemplo, você pode alterar a direção do rosto de uma pessoa. Os vídeos abaixo são do site da equipe de pesquisa. O texto completo do trabalho de pesquisa pode ser lido no site arXiv.

Como aponta a equipe de desenvolvimento, o que é realmente interessante neste trabalho não é a manipulação de imagens em si, mas a interface do usuário. Há muito tempo conseguimos usar ferramentas de IA como GANs para criar imagens realistas, mas a maioria dos métodos carece de flexibilidade e precisão. Você pode dizer ao gerador de imagens AI “faça uma foto de um leão observando a savana” e você conseguirá, mas o leão pode não estar exatamente na posição que você deseja.

DragGAN oferece uma solução para este problema. A interface é exatamente a mesma dos editores de imagem tradicionais, mas em vez de apenas manchar os pixels existentes, o modelo recria o objeto. Os pesquisadores escrevem: “Nossa abordagem pode não apenas criar oclusão de objetos, mas também deformá-los de acordo com a rigidez, por exemplo, ao dobrar a perna de um cavalo”.

Embora esta seja apenas uma demonstração e não aprecie totalmente a tecnologia, é outro exemplo de como tornar a manipulação de imagem assistida por IA mais acessível.

avalanche

Postagens recentes

A Yandex está se preparando para um lançamento em massa de robotáxis e carros autônomos até 2028.

A Yandex planeja começar a comercializar veículos robóticos em 2028, tanto no setor de táxis…

26 minutos atrás

Golpistas começaram a disfarçar malware como código-fonte vazado do Anthropic Claude Code.

Esta semana, o código-fonte do serviço Claude Code da Anthropic vazou — a empresa tomou…

39 minutos atrás

A JEDEC permitirá o crescimento da memória HBM4E para simplificar a produção e reduzir custos.

A memória empilhada, chamada HBM, é considerada uma das mais rápidas do mercado, mas continua…

39 minutos atrás

Uma startup suíça transformou baterias usadas em baterias domésticas por assinatura.

A startup suíça Evolium Technologies, fundada em 2024 com o apoio da Associação Suíça de…

51 minutos atrás

Um modelo chinês do foguete reutilizável Falcon 9 da SpaceX explodiu no ar — ele era movido a querosene produzido a partir do carvão.

Hoje, às 12h17, horário de Pequim (7h17, horário de Moscou), o foguete experimental Tianlong-3, da…

2 horas atrás

A Oracle finalmente encontrou os recursos para construir outro centro de dados de IA OpenAI Stargate.

A Related Digital, investidora em data centers, está perto de fechar um acordo de US$…

2 horas atrás