A empresa Stability AI apresentou o modelo de inteligência artificial Stable Diffusion Medium, projetado para gerar imagens a partir de uma descrição de texto. Sua versão mais antiga, Stable Diffusion 3, foi anunciada em fevereiro e em abril começou a funcionar via API.
O Stable Diffusion Medium foi projetado para ser um modelo menor – muito poderoso, mas capaz de rodar em placas gráficas de consumo. A versão menor do Stable Diffusion 3 será uma opção atraente para usuários e organizações com recursos limitados que precisam executar um sistema de geração de imagens altamente eficiente. Por enquanto, você pode experimentar a nova rede neural através da API, no servidor Stable Artisan via Discord; pesos de modelo também estão disponíveis para uso não comercial no Hugging Face.
Com o lançamento da nova rede neural, o modelo grande apresentado anteriormente passa a se chamar Stable Diffusion 3 (SD3) Large – possui 8 bilhões de parâmetros, enquanto o novo SD3 Medium possui apenas 2 bilhões de parâmetros, mas pode funcionar em placas de vídeo domésticas, apresentando um requisito de sistema de 5 GB de memória de vídeo. Anteriormente, os modelos Stable Diffusion exigiam exclusivamente modelos Nvidia avançados, mas agora placas de vídeo com 16 GB de memória ainda são recomendadas.
Com requisitos de recursos relativamente modestos, o SD3 Medium oferece amplas capacidades comparáveis em diversas funções ao antigo SD3 Large: fotorrealismo, tipografia, compreensão da linguagem natural e do arranjo espacial dos elementos na imagem, alto detalhe por megapixel e alta adaptabilidade com o capacidade de ajuste fino.