Categorias: Editor gráfico

A Alibaba lançou um concorrente para o Nano Banana: um poderoso gerador de imagens com IA chamado Qwen-Image-2.0.

A Alibaba anunciou o lançamento do Qwen-Image-2.0, um modelo de inteligência artificial para geração de imagens. O desenvolvedor alcançou um avanço significativo: o modelo consegue renderizar texto com precisão, permitindo ainda a escolha de diferentes estilos. Ele suporta até mil tokens e a saída pode incluir imagens fotorrealistas, imagens para apresentações, pôsteres, quadrinhos e muito mais.

Fonte da imagem: qwen.ai

A criação do modelo Qwen-Image-2.0 foi precedida por duas linhas paralelas de desenvolvimento em sistemas de IA para gráficos. A primeira consiste na geração de imagens com máxima precisão e detalhes, incluindo a renderização correta de texto. A segunda é a edição de imagens, onde funcionalidade e consistência são importantes, sem distorcer a imagem original. O projeto Qwen-Image-2.0 incorpora a fusão dessas duas linhas de pesquisa em um único modelo universal que combina as vantagens de ambas as abordagens. Ele também apresenta uma arquitetura leve, uma pegada menor e maior velocidade de inferência.

A Alibaba listou as principais vantagens do Qwen-Image-2.0. Além da precisão herdada da área de edição de imagens, o modelo é capaz de criar composições complexas graças ao suporte para consultas detalhadas de até mil tokens. Outra vantagem do Qwen-Image-2.0 é sua qualidade estética, que, em particular, ajuda o modelo a posicionar o texto harmoniosamente em relação às imagens e a selecionar o estilo de fonte apropriado. Um exemplo de realismo é a geração de uma imagem com texto em uma placa brilhante, refletindo os objetos ao redor, bem como o posicionamento harmonioso de objetos e texto em pôsteres de filmes gerados. Por fim, a organização e o alinhamento da composição permitem que o Qwen-Image-2.0 crie histórias em quadrinhos com ilustrações informativas e acompanhamento textual preciso.

A Alibaba realizou um teste cego do Qwen-Image-2.0 na plataforma AI Arena. O desenvolvedor comparou suas capacidades de geração e edição de imagens com as de outros modelos. No primeiro teste, apenas o Gemini-3-Pro-Image-Preview do Google e o OpenAI GPT Image 1.5 se mostraram mais poderosos que o Qwen-Image-2.0; no segundo teste, o modelo chinês ficou em segundo lugar, atrás apenas do principal Gemini.

admin

Compartilhar
Publicado por
admin

Postagens recentes

O Instagram e o TikTok concordaram voluntariamente em passar por uma avaliação de segurança para adolescentes.

Especialistas em saúde mental desenvolveram um sistema que inclui duas dezenas de padrões para avaliar…

19 minutos atrás

Sistemas de inteligência artificial (IA) médicos podem facilmente fornecer conselhos prejudiciais se os sintomas forem descritos de forma inteligente.

Os modernos modelos de linguagem de grande escala (LLMs, na sigla em inglês) usados ​​na…

30 minutos atrás

Cientistas chineses criaram baterias semi-sólidas capazes de suportar temperaturas tão baixas quanto -34°C.

Já se sabe, por notícias relevantes, que uma maneira de criar baterias resistentes ao congelamento…

30 minutos atrás

A ByteDance está desenvolvendo um chip de IA proprietário, com produção planejada para a Samsung.

Grandes empresas de IA estão demonstrando crescente interesse no desenvolvimento de seus próprios aceleradores de…

31 minutos atrás