A Black Forest Labs, empresa que desenvolve redes neurais generativas, apresentou uma nova família de modelos de geração de imagens baseados em texto: o FLUX.2. O software oferece novas ferramentas e recursos, incluindo uma funcionalidade de imagem com múltiplas referências que permite a geração de dezenas de imagens semelhantes com detalhes fotorrealistas e fontes mais nítidas, mesmo em grandes escalas.

Fonte da imagem: Nvidia

De acordo com o blog da Nvidia, o FLUX.2 foi desenvolvido com a participação da empresa, bem como com os desenvolvedores do framework ComfyUI para trabalhar com modelos de IA generativa. Graças a isso, a família FLUX.2 suporta quantização FP8 e é otimizada para GPUs RTX, reduzindo a memória de vídeo necessária em 40% e, simultaneamente, aumentando o desempenho em 40%.

Fonte da imagem: Nvidia

Os modelos não exigem nenhum software especial e são acessíveis diretamente no ambiente ComfyUI. As imagens geradas pelo FLUX.2 são fotorrealistas, mesmo em altas resoluções (até 4 megapixels), com iluminação e física realistas. Como observa a Nvidia, os modelos não criam “efeitos de inteligência artificial que reduzem a fidelidade visual”.

Fonte da imagem: Black Forest Labs

Esses modelos permitem definir diretamente a pose de um objeto ou personagem em uma imagem, além de fornecer texto claro e legível para infográficos, telas de interface do usuário e até mesmo conteúdo multilíngue. Adicionalmente, o novo recurso de múltiplas referências permite que os artistas selecionem até seis imagens de referência com estilo ou tema consistentes, eliminando a necessidade de ajustes extensivos no modelo.

Fonte da imagem: Black Forest Labs

Esses modelos permitem definir diretamente a pose de um objeto ou personagem em uma imagem e fornecer texto claro e legível — para infográficos, telas de interface do usuário e conteúdo multilíngue. Além disso, o novo recurso de múltiplas referências permite que os artistas selecionem até seis referências para combinar com um estilo ou tema, eliminando a necessidade de extensa personalização manual do modelo.

Fonte da imagem: Black Forest Labs
O FLUX.2 é impressionante, mas também bastante exigente em termos de recursos. O modelo inclui 32 bilhões de parâmetros e requer 90 GB de memória de vídeo para carregar completamente. Mesmo no modo de baixa VRAM — um modo popular que carrega apenas a parte ativa do modelo — os requisitos são de 64 GB, tornando o FLUX.2 praticamente inutilizável em placas de vídeo para o consumidor comum.

Para ampliar a disponibilidade do FLUX.2, a Nvidia e a Black Forest Labs colaboraram para quantizar o modelo para FP8, reduzindo os requisitos de memória de vídeo em 40% sem sacrificar a qualidade. A Nvidia também está colaborando com os desenvolvedores do ComfyUI, um aplicativo popular para executar modelos de IA visual em PCs, para aprimorar o recurso de descarregamento de memória conhecido como streaming de pesos. Isso permite que os usuários descarreguem partes do modelo para a memória do sistema, expandindo assim a memória de vídeo disponível, embora com uma pequena perda de desempenho devido à menor velocidade da memória do sistema em comparação com a memória da GPU.

Para trabalhar com modelos FLUX.2, é necessária uma atualização do ComfyUI.Você também pode visitar a página da Black Forest Labs no Hugging Face.para carregar os pesos do modelo.

By admin

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *