A startup Black Forest Labs apresentou o gerador de imagens AI FLUX.1 – ele faz um excelente trabalho ao desenhar mãos humanas

No final da semana passada, a startup Black Forest Labs anunciou o início de suas atividades no desenvolvimento de redes neurais generativas. Ao mesmo tempo, a empresa, criada por pessoas da Stability AI, introduziu uma família de modelos para geração de imagens baseadas em descrições de texto denominada FLUX.1, que afirmam ser os melhores da sua classe.

Fonte da imagem: FLUX.1

O lançamento do FLUX.1 ocorre cerca de sete semanas depois que a Stability AI lançou o gerador de IA Stable Diffusion 3 Medium em meados de junho, que recebeu muitas críticas devido à má qualidade na criação de imagens que contêm pessoas. Os usuários compartilharam ativamente nas redes sociais os resultados da geração de um algoritmo com membros e corpos distorcidos de pessoas.

O lançamento do Stable Diffusion 3 Medium segue a saída de três funcionários importantes da Stability AI – Robin Rombach, Andreas Blattmann e Dominik Lorenz. Foram eles, junto com Patrick Esser, que participaram do desenvolvimento da primeira versão do Stable Diffusion e desde então trabalharam em vários algoritmos de IA, assim como outros engenheiros, que fundaram a empresa Black Forest Lab.

No momento, a startup apresentou três modelos de geração de descrições textuais FLUX.1. O modelo FLUX.1 pro AI é o gerador de imagens mais poderoso disponível para uso comercial por meio de sua API. Ao mesmo tempo, foi lançado o FLUX.1 dev, disponível para uso não comercial, bem como o FLUX.1 schnell, mais leve e rápido (traduzido do alemão como “rápido” ou “rápido”).

Os desenvolvedores afirmam que seus modelos de IA são superiores aos análogos existentes, como Midjourney e DALL-E, em vários indicadores, incluindo a qualidade das imagens geradas e a precisão de seguir a descrição original. Em geral, os resultados da geração FLUX.1 são comparáveis ​​​​aos que podem ser criados usando DALL-E 3 da OpenAI em termos de precisão de seguir a descrição e estão próximos em fotorrealismo ao Midjourney 6. Além disso, o algoritmo funciona claramente melhor em comparação ao Stable Diffusion XL, o último grande lançamento dessa equipe de desenvolvimento quando ainda faziam parte do Stability AI, sem contar o Stable Diffusion XL Turbo.

Os modelos do Black Forest Lab são construídos em uma arquitetura híbrida que combina métodos de transformação e difusão, ampliando até 12 bilhões de parâmetros. Parece que esta abordagem torna a rede neural FLUX.1 capaz de gerar mãos humanas de alta qualidade, o que era o ponto fraco de muitos análogos já lançados no mercado. No entanto, os desenvolvedores não especificaram em quais dados os modelos FLUX.1 foram treinados.

Observe que o Black Forest Lab já atraiu financiamento no valor de US$ 31 milhões. Quem quiser experimentar o FLUX.1 em ação pode usar os serviços Fal.ai ou Replicate.com, onde terá que pagar para trabalhar com os algoritmos. .

avalanche

Postagens recentes

As ações da SpaceX serão adicionadas ao índice Nasdaq 100 em um cronograma acelerado, ampliando o acesso para os investidores.

A Russell, gestora de índices de ações, confirmou ontem que as ações da SpaceX serão…

18 minutos atrás

A Anthropic recebeu autorização para restaurar o acesso ao Mythos 5 para alguns clientes.

Há algumas semanas, as autoridades americanas ordenaram que cidadãos estrangeiros bloqueassem o acesso aos modelos…

60 minutos atrás

A China dobrará o tamanho de sua estação orbital Tiangong nos próximos anos e lançará um telescópio da classe Hubble.

A China planeja expandir sua estação espacial Tiangong de três para seis módulos nos próximos…

6 horas atrás

Chamado dos Deuses Anciãos – O Conforto do Desconhecido. Resenha

Jogado no PC Call of the Sea foi uma estreia vibrante para a Out of…

7 horas atrás

A OpenAI apresentou o GPT-5.6 Sol, Terra e Luna, mas apenas alguns selecionados tiveram acesso aos novos modelos.

A OpenAI apresentou oficialmente sua família de modelos de linguagem GPT-5.6, que inclui três modelos…

10 horas atrás