A Alibaba anunciou o lançamento do Qwen-Image-2.0, um modelo de inteligência artificial para geração de imagens. O desenvolvedor alcançou um avanço significativo: o modelo consegue renderizar texto com precisão, permitindo ainda a escolha de diferentes estilos. Ele suporta até mil tokens e a saída pode incluir imagens fotorrealistas, imagens para apresentações, pôsteres, quadrinhos e muito mais.
Fonte da imagem: qwen.ai
A criação do modelo Qwen-Image-2.0 foi precedida por duas linhas paralelas de desenvolvimento em sistemas de IA para gráficos. A primeira consiste na geração de imagens com máxima precisão e detalhes, incluindo a renderização correta de texto. A segunda é a edição de imagens, onde funcionalidade e consistência são importantes, sem distorcer a imagem original. O projeto Qwen-Image-2.0 incorpora a fusão dessas duas linhas de pesquisa em um único modelo universal que combina as vantagens de ambas as abordagens. Ele também apresenta uma arquitetura leve, uma pegada menor e maior velocidade de inferência.
A Alibaba listou as principais vantagens do Qwen-Image-2.0. Além da precisão herdada da área de edição de imagens, o modelo é capaz de criar composições complexas graças ao suporte para consultas detalhadas de até mil tokens. Outra vantagem do Qwen-Image-2.0 é sua qualidade estética, que, em particular, ajuda o modelo a posicionar o texto harmoniosamente em relação às imagens e a selecionar o estilo de fonte apropriado. Um exemplo de realismo é a geração de uma imagem com texto em uma placa brilhante, refletindo os objetos ao redor, bem como o posicionamento harmonioso de objetos e texto em pôsteres de filmes gerados. Por fim, a organização e o alinhamento da composição permitem que o Qwen-Image-2.0 crie histórias em quadrinhos com ilustrações informativas e acompanhamento textual preciso.
A Alibaba realizou um teste cego do Qwen-Image-2.0 na plataforma AI Arena. O desenvolvedor comparou suas capacidades de geração e edição de imagens com as de outros modelos. No primeiro teste, apenas o Gemini-3-Pro-Image-Preview do Google e o OpenAI GPT Image 1.5 se mostraram mais poderosos que o Qwen-Image-2.0; no segundo teste, o modelo chinês ficou em segundo lugar, atrás apenas do principal Gemini.
Especialistas em saúde mental desenvolveram um sistema que inclui duas dezenas de padrões para avaliar…
Os modernos modelos de linguagem de grande escala (LLMs, na sigla em inglês) usados na…
Já se sabe, por notícias relevantes, que uma maneira de criar baterias resistentes ao congelamento…
A OpenAI não só possui um comitê para o desenvolvimento seguro de IA, como também…
Grandes empresas de IA estão demonstrando crescente interesse no desenvolvimento de seus próprios aceleradores de…
A Xiaomi apresentou uma versão atualizada do seu monitor QHD de 27 polegadas acessível, o…