Categorias: Inteligência Artificial, Aprendizado de Máquina, Redes NeuraisMercado de tecnologia e TI. notícia

Stability AI lança gerador de imagem Stable Diffusion XL 1.0 AI que pode ser executado em hardware de computação “simples”

A startup de IA Stability AI lançou uma nova versão de código aberto de seu principal modelo de conversão de texto em imagem, Stable Diffusion XL 1.0 (SDXL 1.0), que considera seu modelo “mais avançado” até o momento.

Fonte da imagem: Pixabay

Disponível no GitHub, além da API de estabilidade e dos aplicativos de consumidor Clipdrop e DreamStudio, o SDXL 1.0 oferece cores “mais brilhantes” e “precisas” e melhor contraste, sombras e iluminação em comparação com a versão anterior, diz Stability.

Joe Penna, chefe de aprendizado de máquina aplicado da Stability AI, disse ao TechCrunch que o SDXL 1.0, com 3,5 bilhões de parâmetros, pode produzir imagens de 1 megapixel “em segundos” com várias proporções.

O modelo Stable Diffusion XL 0.9 da geração anterior também podia produzir imagens de alta resolução, mas exigia mais poder de processamento para funcionar. Como o SiliconANGLE apontou, o código-fonte aberto, junto com a capacidade de rodar em hardware relativamente simples, torna o SDXL 1.0 muito mais acessível do que os modelos de imagem concorrentes.

«O SDXL 1.0 é personalizável e pronto para ser ajustado para se adequar a conceitos e estilos”, disse Penna. “Também é fácil de usar, com a capacidade de criar projetos complexos com consultas básicas de processamento de linguagem natural.”

Além disso, o SDXL 1.0 recebeu melhorias na área de geração de texto. Embora muitos dos melhores modelos de conversão de texto em imagem tenham problemas para gerar imagens com logotipos legíveis, muito menos caligrafia ou fontes, o SDXL 1.0 é capaz de geração e legibilidade “avançadas” de texto, diz Penna.

O SDXL 1.0 apresenta pintura interna para restaurar partes ausentes de uma imagem, pintura externa (expansão de imagens existentes) e dicas de imagem para imagem para adicionar várias dicas de texto após a entrada de uma imagem para criar variações mais detalhadas dessa imagem. Além disso, o modelo “entende” instruções complexas de várias partes dadas em prompts curtos, enquanto os modelos anteriores de difusão estável exigiam prompts de texto mais longos.

O conjunto de treinamento SDXL 1.0 também inclui o trabalho de artistas que protestaram contra empresas, incluindo Stability AI, usando seu trabalho como dados de treinamento para modelos generativos de IA. Stability AI afirma estar protegida de responsabilidade legal pela doutrina de uso justo, pelo menos nos EUA. Embora isso não tenha impedido a Getty Images de processar a Stability AI por usar ilegalmente as imagens do serviço para treinar sua rede neural generativa.

avalanche

Próximo Samsung registra prejuízo de US$ 7 bilhões desde o início do ano no mercado de componentes semicondutores »

Anterior « Volkswagen comprará participação de 5% na XPeng e desenvolverá veículos elétricos em conjunto na China

Deixar comentário

Publicado por

avalanche

3 anos atrás

Postagens recentes

Jogos

“Senti que estava desmoronando”: Os desenvolvedores principais de Suicide Squad: Kill the Justice League quase abandonaram a indústria após o fracasso do jogo.

O fracasso do jogo de ação cooperativo da Rocksteady Studios, Suicide Squad: Kill the Justice…

58 minutos atrás

Sistemas operacionais

OxygenOS e Realme UI serão relegados ao passado – OnePlus e Realme migrarão para o ColorOS.

O OxygenOS e a Realme UI não serão mais usados nos novos modelos de smartphones…

1 hora atrás

Desenvolvimento e fabricação de eletrônicos

IFixit criará um padrão unificado para a reparabilidade de eletrônicos nos EUA.

A iFixit, em parceria com a NSF, organização global independente de serviços, iniciou o desenvolvimento…

1 hora atrás

Jogos

A Epic Games Store revelou os planos da Square Enix para expansões da história de Final Fantasy VII Revelation.

Embora a editora Square Enix já tenha dividido o remake do cultuado RPG japonês Final…

2 horas atrás

Jogos

Cyberpunk 2077 vendeu mais de 40 milhões de cópias nos cinco anos e meio desde o seu lançamento.

As vendas de Cyberpunk 2077 ultrapassaram 40 milhões de cópias, anunciaram os desenvolvedores do RPG…

2 horas atrás

Inteligência Artificial, Aprendizado de Máquina, Redes Neurais

A Alibaba proibiu seus funcionários de usar o assistente de programação Claude Code, da Anthropic.

Após a American Anthropic acusar a Alibaba, da China, de extrair, ou efetivamente roubar, dados…

2 horas atrás

Stability AI lança gerador de imagem Stable Diffusion XL 1.0 AI que pode ser executado em hardware de computação “simples”

Conteúdo relacionado

Postagens recentes

“Senti que estava desmoronando”: Os desenvolvedores principais de Suicide Squad: Kill the Justice League quase abandonaram a indústria após o fracasso do jogo.

OxygenOS e Realme UI serão relegados ao passado – OnePlus e Realme migrarão para o ColorOS.

IFixit criará um padrão unificado para a reparabilidade de eletrônicos nos EUA.

A Epic Games Store revelou os planos da Square Enix para expansões da história de Final Fantasy VII Revelation.

Cyberpunk 2077 vendeu mais de 40 milhões de cópias nos cinco anos e meio desde o seu lançamento.

A Alibaba proibiu seus funcionários de usar o assistente de programação Claude Code, da Anthropic.