No final da semana passada, a startup Black Forest Labs anunciou o início de suas atividades no desenvolvimento de redes neurais generativas. Ao mesmo tempo, a empresa, criada por pessoas da Stability AI, introduziu uma família de modelos para geração de imagens baseadas em descrições de texto denominada FLUX.1, que afirmam ser os melhores da sua classe.
O lançamento do FLUX.1 ocorre cerca de sete semanas depois que a Stability AI lançou o gerador de IA Stable Diffusion 3 Medium em meados de junho, que recebeu muitas críticas devido à má qualidade na criação de imagens que contêm pessoas. Os usuários compartilharam ativamente nas redes sociais os resultados da geração de um algoritmo com membros e corpos distorcidos de pessoas.
O lançamento do Stable Diffusion 3 Medium segue a saída de três funcionários importantes da Stability AI – Robin Rombach, Andreas Blattmann e Dominik Lorenz. Foram eles, junto com Patrick Esser, que participaram do desenvolvimento da primeira versão do Stable Diffusion e desde então trabalharam em vários algoritmos de IA, assim como outros engenheiros, que fundaram a empresa Black Forest Lab.
No momento, a startup apresentou três modelos de geração de descrições textuais FLUX.1. O modelo FLUX.1 pro AI é o gerador de imagens mais poderoso disponível para uso comercial por meio de sua API. Ao mesmo tempo, foi lançado o FLUX.1 dev, disponível para uso não comercial, bem como o FLUX.1 schnell, mais leve e rápido (traduzido do alemão como “rápido” ou “rápido”).
Os desenvolvedores afirmam que seus modelos de IA são superiores aos análogos existentes, como Midjourney e DALL-E, em vários indicadores, incluindo a qualidade das imagens geradas e a precisão de seguir a descrição original. Em geral, os resultados da geração FLUX.1 são comparáveis aos que podem ser criados usando DALL-E 3 da OpenAI em termos de precisão de seguir a descrição e estão próximos em fotorrealismo ao Midjourney 6. Além disso, o algoritmo funciona claramente melhor em comparação ao Stable Diffusion XL, o último grande lançamento dessa equipe de desenvolvimento quando ainda faziam parte do Stability AI, sem contar o Stable Diffusion XL Turbo.
Os modelos do Black Forest Lab são construídos em uma arquitetura híbrida que combina métodos de transformação e difusão, ampliando até 12 bilhões de parâmetros. Parece que esta abordagem torna a rede neural FLUX.1 capaz de gerar mãos humanas de alta qualidade, o que era o ponto fraco de muitos análogos já lançados no mercado. No entanto, os desenvolvedores não especificaram em quais dados os modelos FLUX.1 foram treinados.
Observe que o Black Forest Lab já atraiu financiamento no valor de US$ 31 milhões. Quem quiser experimentar o FLUX.1 em ação pode usar os serviços Fal.ai ou Replicate.com, onde terá que pagar para trabalhar com os algoritmos. .