A startup Black Forest Labs apresentou o gerador de imagens AI FLUX.1 – ele faz um excelente trabalho ao desenhar mãos humanas

No final da semana passada, a startup Black Forest Labs anunciou o início de suas atividades no desenvolvimento de redes neurais generativas. Ao mesmo tempo, a empresa, criada por pessoas da Stability AI, introduziu uma família de modelos para geração de imagens baseadas em descrições de texto denominada FLUX.1, que afirmam ser os melhores da sua classe.

Fonte da imagem: FLUX.1

O lançamento do FLUX.1 ocorre cerca de sete semanas depois que a Stability AI lançou o gerador de IA Stable Diffusion 3 Medium em meados de junho, que recebeu muitas críticas devido à má qualidade na criação de imagens que contêm pessoas. Os usuários compartilharam ativamente nas redes sociais os resultados da geração de um algoritmo com membros e corpos distorcidos de pessoas.

O lançamento do Stable Diffusion 3 Medium segue a saída de três funcionários importantes da Stability AI – Robin Rombach, Andreas Blattmann e Dominik Lorenz. Foram eles, junto com Patrick Esser, que participaram do desenvolvimento da primeira versão do Stable Diffusion e desde então trabalharam em vários algoritmos de IA, assim como outros engenheiros, que fundaram a empresa Black Forest Lab.

No momento, a startup apresentou três modelos de geração de descrições textuais FLUX.1. O modelo FLUX.1 pro AI é o gerador de imagens mais poderoso disponível para uso comercial por meio de sua API. Ao mesmo tempo, foi lançado o FLUX.1 dev, disponível para uso não comercial, bem como o FLUX.1 schnell, mais leve e rápido (traduzido do alemão como “rápido” ou “rápido”).

Os desenvolvedores afirmam que seus modelos de IA são superiores aos análogos existentes, como Midjourney e DALL-E, em vários indicadores, incluindo a qualidade das imagens geradas e a precisão de seguir a descrição original. Em geral, os resultados da geração FLUX.1 são comparáveis ​​​​aos que podem ser criados usando DALL-E 3 da OpenAI em termos de precisão de seguir a descrição e estão próximos em fotorrealismo ao Midjourney 6. Além disso, o algoritmo funciona claramente melhor em comparação ao Stable Diffusion XL, o último grande lançamento dessa equipe de desenvolvimento quando ainda faziam parte do Stability AI, sem contar o Stable Diffusion XL Turbo.

Os modelos do Black Forest Lab são construídos em uma arquitetura híbrida que combina métodos de transformação e difusão, ampliando até 12 bilhões de parâmetros. Parece que esta abordagem torna a rede neural FLUX.1 capaz de gerar mãos humanas de alta qualidade, o que era o ponto fraco de muitos análogos já lançados no mercado. No entanto, os desenvolvedores não especificaram em quais dados os modelos FLUX.1 foram treinados.

Observe que o Black Forest Lab já atraiu financiamento no valor de US$ 31 milhões. Quem quiser experimentar o FLUX.1 em ação pode usar os serviços Fal.ai ou Replicate.com, onde terá que pagar para trabalhar com os algoritmos. .

avalanche

Postagens recentes

Controlador Logitech F710 preso em novo processo sobre queda do submersível Titan

A família do explorador francês de águas profundas Paul-Henri Louis Emile Nargeolet, que morreu como…

44 minutos atrás

Citylink contratou robôs para avaliar smartphones usados

O varejista online Citylink anunciou o lançamento, em conjunto com o classificado Avito, de um…

59 minutos atrás

O aplicativo VK Video atingiu 20 milhões de instalações em meio a problemas com o YouTube

Anteriormente, foi relatado que o aplicativo VK Video se tornou líder em downloads nos mercados…

59 minutos atrás