No final da semana passada, a startup Black Forest Labs anunciou o início de suas atividades no desenvolvimento de redes neurais generativas. Ao mesmo tempo, a empresa, criada por pessoas da Stability AI, introduziu uma família de modelos para geração de imagens baseadas em descrições de texto denominada FLUX.1, que afirmam ser os melhores da sua classe.

Fonte da imagem: FLUX.1

O lançamento do FLUX.1 ocorre cerca de sete semanas depois que a Stability AI lançou o gerador de IA Stable Diffusion 3 Medium em meados de junho, que recebeu muitas críticas devido à má qualidade na criação de imagens que contêm pessoas. Os usuários compartilharam ativamente nas redes sociais os resultados da geração de um algoritmo com membros e corpos distorcidos de pessoas.

O lançamento do Stable Diffusion 3 Medium segue a saída de três funcionários importantes da Stability AI – Robin Rombach, Andreas Blattmann e Dominik Lorenz. Foram eles, junto com Patrick Esser, que participaram do desenvolvimento da primeira versão do Stable Diffusion e desde então trabalharam em vários algoritmos de IA, assim como outros engenheiros, que fundaram a empresa Black Forest Lab.

No momento, a startup apresentou três modelos de geração de descrições textuais FLUX.1. O modelo FLUX.1 pro AI é o gerador de imagens mais poderoso disponível para uso comercial por meio de sua API. Ao mesmo tempo, foi lançado o FLUX.1 dev, disponível para uso não comercial, bem como o FLUX.1 schnell, mais leve e rápido (traduzido do alemão como “rápido” ou “rápido”).

Os desenvolvedores afirmam que seus modelos de IA são superiores aos análogos existentes, como Midjourney e DALL-E, em vários indicadores, incluindo a qualidade das imagens geradas e a precisão de seguir a descrição original. Em geral, os resultados da geração FLUX.1 são comparáveis ​​​​aos que podem ser criados usando DALL-E 3 da OpenAI em termos de precisão de seguir a descrição e estão próximos em fotorrealismo ao Midjourney 6. Além disso, o algoritmo funciona claramente melhor em comparação ao Stable Diffusion XL, o último grande lançamento dessa equipe de desenvolvimento quando ainda faziam parte do Stability AI, sem contar o Stable Diffusion XL Turbo.

Os modelos do Black Forest Lab são construídos em uma arquitetura híbrida que combina métodos de transformação e difusão, ampliando até 12 bilhões de parâmetros. Parece que esta abordagem torna a rede neural FLUX.1 capaz de gerar mãos humanas de alta qualidade, o que era o ponto fraco de muitos análogos já lançados no mercado. No entanto, os desenvolvedores não especificaram em quais dados os modelos FLUX.1 foram treinados.

Observe que o Black Forest Lab já atraiu financiamento no valor de US$ 31 milhões. Quem quiser experimentar o FLUX.1 em ação pode usar os serviços Fal.ai ou Replicate.com, onde terá que pagar para trabalhar com os algoritmos. .

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *