Pesquisadores do Instituto de Tecnologia de Massachusetts (MIT) conseguiram acelerar significativamente a criação de imagens a partir de descrições de texto usando inteligência artificial generativa. O novo método permite gerar imagens de alta definição 30 vezes mais rápido que as existentes.
Imagem Fonte: Pixabay.com
Normalmente, a IA generativa usa uma técnica chamada “difusão”, que cria uma imagem o mais desfocada possível e depois a refina em um resultado final que se aproxima do que a IA pode produzir em resposta à solicitação de um usuário. A difusão leva muito tempo, então os pesquisadores do MIT decidiram acelerá-la.
Fonte da imagem: tianweiy.github.io
Pesquisadores do Laboratório de Ciência da Computação e Inteligência Artificial do MIT reduziram a geração de imagens a uma única passagem, e o novo método é chamado de “destilação por correspondência de distribuição”. É óbvio que gerar uma imagem em uma passagem é visivelmente mais rápido do que os 30 a 50 passos típicos dos modelos de difusão. Assim, em equipamentos modernos, o Stable Diffusion 1.5 cria uma imagem em 1,5 segundos, enquanto o novo modelo baseado em DMD faz isso em 0,05 segundos.
Esta não é a primeira tentativa de destilar modelos de difusão para acelerar a geração de imagens. Instaflow e LCM tentaram uma abordagem semelhante, mas os resultados não foram impressionantes. A Stability AI também tentou acelerar os modelos de difusão e teve algum sucesso com o lançamento do Stable Diffusion Turbo, que cria imagens com resolução de até 1 megapixel em uma única passagem, mas as imagens geradas em várias passagens ainda ficaram visivelmente melhores.
A espaçonave Orion continua sua jornada rumo à Lua como parte da missão Artemis II…
Após a Apple adotar os processadores da série M em seus computadores Mac, conectar placas…
O Google Chrome e outros navegadores baseados no Chromium, incluindo o Edge e o Vivaldi,…
O Google Chrome e outros navegadores baseados no Chromium, incluindo o Edge e o Vivaldi,…
O Google Chrome e outros navegadores baseados no Chromium, incluindo o Edge e o Vivaldi,…
Intel Core i5-6600K 3.5 GHz / AMD Ryzen 3 1200 3.1 GHz, 8 GB de…