Alibaba revela gerador de imagens Qwen-Image com IA e alta taxa de alfabetização

O Alibaba apresentou o modelo de IA Qwen-Image 20B MMDiT, projetado para trabalhar com imagens. Nele, o desenvolvedor melhorou significativamente os mecanismos para desenhar textos complexos e implementou a capacidade de editar imagens com precisão.

Fonte da imagem: huggingface.co/Qwen

O modelo, que estará disponível na plataforma Qwen Chat na seção Geração de Imagens, possui recursos avançados de renderização de texto, incluindo layouts multilinha com semântica em nível de parágrafo e elementos detalhados. Idiomas baseados em letras e hieróglifos são suportados. Mecanismos aprimorados de aprendizado multitarefa ajudaram a expandir os recursos de edição de imagens, preservando o conteúdo semântico e o realismo visual.

O novo Qwen-Image, afirma o Alibaba, superou as soluções existentes em diversos testes para tarefas de geração e edição de imagens, incluindo GenEval, DPG, OneIG-Bench, GEdit, ImgEdit e GSO. O sucesso foi particularmente significativo em testes de qualidade de renderização de texto, como LongText-Bench, ChineseWord e TextCraft — o novo modelo superou os análogos modernos. O Qwen-Image, em particular, lida com a exibição precisa de caracteres chineses em placas de lojas com a profundidade de campo correta, com a criação de texto detalhado em inglês em capas de livros e slides informativos, e suporta o trabalho com conteúdo bilíngue.

Além do processamento de texto, o modelo é fluente em gêneros artísticos, do fotorrealismo ao impressionismo; diversas operações de edição de imagem são suportadas, incluindo alteração de estilo, adição, remoção e aprimoramento de detalhes, bem como edição de texto e alteração de poses de personagens. No projeto Qwen-Image, os desenvolvedores do Alibaba, em suas palavras, buscaram promover o desenvolvimento da geração de imagens, reduzir as barreiras técnicas à criação de materiais visuais e inspirar colegas a desenvolver aplicações inovadoras.

admin

Postagens recentes

A Funcom está atualizando Conan Exiles para a Unreal Engine 5 gratuitamente – Trailer e detalhes de Conan Exiles Enhanced

A editora e desenvolvedora norueguesa Funcom, em colaboração com o estúdio canadense Inflexion Games (Nightingale),…

38 minutos atrás

A União Europeia está forçando o Google a abrir o Android para concorrentes do Gemini.

O Google está enfrentando crescente pressão da União Europeia para permitir que assistentes de IA…

2 horas atrás

Elon Musk terá que devolver US$ 29 bilhões à Tesla para receber seu bônus de longa data de US$ 56 bilhões.

Em 21 de abril, o conselho de administração da Tesla revogou por unanimidade uma bonificação…

3 horas atrás

A Honor apresentou o poderoso notebook gamer Win H9 com seis ventoinhas para operação silenciosa.

A Honor apresentou o notebook gamer Win H9. O sistema vem equipado com seis ventoinhas…

3 horas atrás

A Marvell adquire a Polariton, desenvolvedora de soluções plasmônicas.

A Marvell Technology anunciou a aquisição da Polariton Technologies, desenvolvedora de dispositivos fotônicos de alta…

4 horas atrás

Tim Cook revelou seu primeiro grande erro como CEO da Apple.

O CEO da Apple, Tim Cook, classificou o lançamento fracassado do Apple Maps em 2012…

4 horas atrás