Pesquisadores do Instituto de Tecnologia de Massachusetts (MIT) conseguiram acelerar significativamente a criação de imagens a partir de descrições de texto usando inteligência artificial generativa. O novo método permite gerar imagens de alta definição 30 vezes mais rápido que as existentes.

Imagem Fonte: Pixabay.com

Normalmente, a IA generativa usa uma técnica chamada “difusão”, que cria uma imagem o mais desfocada possível e depois a refina em um resultado final que se aproxima do que a IA pode produzir em resposta à solicitação de um usuário. A difusão leva muito tempo, então os pesquisadores do MIT decidiram acelerá-la.

Fonte da imagem: tianweiy.github.io

Pesquisadores do Laboratório de Ciência da Computação e Inteligência Artificial do MIT reduziram a geração de imagens a uma única passagem, e o novo método é chamado de “destilação por correspondência de distribuição”. É óbvio que gerar uma imagem em uma passagem é visivelmente mais rápido do que os 30 a 50 passos típicos dos modelos de difusão. Assim, em equipamentos modernos, o Stable Diffusion 1.5 cria uma imagem em 1,5 segundos, enquanto o novo modelo baseado em DMD faz isso em 0,05 segundos.

Esta não é a primeira tentativa de destilar modelos de difusão para acelerar a geração de imagens. Instaflow e LCM tentaram uma abordagem semelhante, mas os resultados não foram impressionantes. A Stability AI também tentou acelerar os modelos de difusão e teve algum sucesso com o lançamento do Stable Diffusion Turbo, que cria imagens com resolução de até 1 megapixel em uma única passagem, mas as imagens geradas em várias passagens ainda ficaram visivelmente melhores.

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *