Pesquisadores do Instituto de Tecnologia de Massachusetts (MIT) conseguiram acelerar significativamente a criação de imagens a partir de descrições de texto usando inteligência artificial generativa. O novo método permite gerar imagens de alta definição 30 vezes mais rápido que as existentes.

Imagem Fonte: Pixabay.com

Normalmente, a IA generativa usa uma técnica chamada “difusão”, que cria uma imagem o mais desfocada possível e depois a refina em um resultado final que se aproxima do que a IA pode produzir em resposta à solicitação de um usuário. A difusão leva muito tempo, então os pesquisadores do MIT decidiram acelerá-la.

Fonte da imagem: tianweiy.github.io

Pesquisadores do Laboratório de Ciência da Computação e Inteligência Artificial do MIT reduziram a geração de imagens a uma única passagem, e o novo método é chamado de “destilação por correspondência de distribuição”. É óbvio que gerar uma imagem em uma passagem é visivelmente mais rápido do que os 30 a 50 passos típicos dos modelos de difusão. Assim, em equipamentos modernos, o Stable Diffusion 1.5 cria uma imagem em 1,5 segundos, enquanto o novo modelo baseado em DMD faz isso em 0,05 segundos.

Esta não é a primeira tentativa de destilar modelos de difusão para acelerar a geração de imagens. Instaflow e LCM tentaram uma abordagem semelhante, mas os resultados não foram impressionantes. A Stability AI também tentou acelerar os modelos de difusão e teve algum sucesso com o lançamento do Stable Diffusion Turbo, que cria imagens com resolução de até 1 megapixel em uma única passagem, mas as imagens geradas em várias passagens ainda ficaram visivelmente melhores.

avalanche

Postagens recentes

Um britânico construiu uma motocicleta movida a vapor que se tornou a segunda moto mais rápida do mundo.

No evento Festival of Power, na vila britânica de Podington, Bedfordshire, na pista de aceleração…

2 horas atrás

Astrônomos observaram, pela primeira vez, uma explosão de supernova inexplicável, o que exige uma nova teoria.

Astrônomos podem ter descoberto um novo tipo de explosão cósmica, apelidada de "superkilonova". Este evento,…

5 horas atrás

Um entusiasta de hardware modificou a VBIOS de uma placa gráfica S3 antiga para tornar o preto verdadeiramente preto.

Um criador de conteúdo do canal do YouTube Bits und Bolts descobriu uma falha em…

5 horas atrás

US$ 50 para proteger sua RTX 5090 contra burn-in: a Asus revela o preço do seu cabo ROG Equalizer.

A Asus começou a vender o cabo ROG Equalizer separadamente, que reduz a distribuição desigual…

6 horas atrás

A AMD lançou o sistema de overclocking de memória EXPO 1.2, que irá desbloquear todo o potencial do Zen 6.

A tão aguardada atualização de overclock de memória AMD EXPO 1.2 já está disponível para…

7 horas atrás

O WhatsApp para Android passará a oferecer suporte a “bolhas”, um formato de notificação do sistema pouco conhecido.

O Google Android possui um recurso integrado chamado "Bolhas" ou "Chat Heads" — um formato…

7 horas atrás