Pesquisadores do Instituto de Tecnologia de Massachusetts (MIT) conseguiram acelerar significativamente a criação de imagens a partir de descrições de texto usando inteligência artificial generativa. O novo método permite gerar imagens de alta definição 30 vezes mais rápido que as existentes.
Imagem Fonte: Pixabay.com
Normalmente, a IA generativa usa uma técnica chamada “difusão”, que cria uma imagem o mais desfocada possível e depois a refina em um resultado final que se aproxima do que a IA pode produzir em resposta à solicitação de um usuário. A difusão leva muito tempo, então os pesquisadores do MIT decidiram acelerá-la.
Fonte da imagem: tianweiy.github.io
Pesquisadores do Laboratório de Ciência da Computação e Inteligência Artificial do MIT reduziram a geração de imagens a uma única passagem, e o novo método é chamado de “destilação por correspondência de distribuição”. É óbvio que gerar uma imagem em uma passagem é visivelmente mais rápido do que os 30 a 50 passos típicos dos modelos de difusão. Assim, em equipamentos modernos, o Stable Diffusion 1.5 cria uma imagem em 1,5 segundos, enquanto o novo modelo baseado em DMD faz isso em 0,05 segundos.
Esta não é a primeira tentativa de destilar modelos de difusão para acelerar a geração de imagens. Instaflow e LCM tentaram uma abordagem semelhante, mas os resultados não foram impressionantes. A Stability AI também tentou acelerar os modelos de difusão e teve algum sucesso com o lançamento do Stable Diffusion Turbo, que cria imagens com resolução de até 1 megapixel em uma única passagem, mas as imagens geradas em várias passagens ainda ficaram visivelmente melhores.
No evento Festival of Power, na vila britânica de Podington, Bedfordshire, na pista de aceleração…
Astrônomos podem ter descoberto um novo tipo de explosão cósmica, apelidada de "superkilonova". Este evento,…
Um criador de conteúdo do canal do YouTube Bits und Bolts descobriu uma falha em…
A Asus começou a vender o cabo ROG Equalizer separadamente, que reduz a distribuição desigual…
A tão aguardada atualização de overclock de memória AMD EXPO 1.2 já está disponível para…
O Google Android possui um recurso integrado chamado "Bolhas" ou "Chat Heads" — um formato…