Categorias: Editor gráfico

A Alibaba lançou um concorrente para o Nano Banana: um poderoso gerador de imagens com IA chamado Qwen-Image-2.0.

A Alibaba anunciou o lançamento do Qwen-Image-2.0, um modelo de inteligência artificial para geração de imagens. O desenvolvedor alcançou um avanço significativo: o modelo consegue renderizar texto com precisão, permitindo ainda a escolha de diferentes estilos. Ele suporta até mil tokens e a saída pode incluir imagens fotorrealistas, imagens para apresentações, pôsteres, quadrinhos e muito mais.

Fonte da imagem: qwen.ai

A criação do modelo Qwen-Image-2.0 foi precedida por duas linhas paralelas de desenvolvimento em sistemas de IA para gráficos. A primeira consiste na geração de imagens com máxima precisão e detalhes, incluindo a renderização correta de texto. A segunda é a edição de imagens, onde funcionalidade e consistência são importantes, sem distorcer a imagem original. O projeto Qwen-Image-2.0 incorpora a fusão dessas duas linhas de pesquisa em um único modelo universal que combina as vantagens de ambas as abordagens. Ele também apresenta uma arquitetura leve, uma pegada menor e maior velocidade de inferência.

A Alibaba listou as principais vantagens do Qwen-Image-2.0. Além da precisão herdada da área de edição de imagens, o modelo é capaz de criar composições complexas graças ao suporte para consultas detalhadas de até mil tokens. Outra vantagem do Qwen-Image-2.0 é sua qualidade estética, que, em particular, ajuda o modelo a posicionar o texto harmoniosamente em relação às imagens e a selecionar o estilo de fonte apropriado. Um exemplo de realismo é a geração de uma imagem com texto em uma placa brilhante, refletindo os objetos ao redor, bem como o posicionamento harmonioso de objetos e texto em pôsteres de filmes gerados. Por fim, a organização e o alinhamento da composição permitem que o Qwen-Image-2.0 crie histórias em quadrinhos com ilustrações informativas e acompanhamento textual preciso.

A Alibaba realizou um teste cego do Qwen-Image-2.0 na plataforma AI Arena. O desenvolvedor comparou suas capacidades de geração e edição de imagens com as de outros modelos. No primeiro teste, apenas o Gemini-3-Pro-Image-Preview do Google e o OpenAI GPT Image 1.5 se mostraram mais poderosos que o Qwen-Image-2.0; no segundo teste, o modelo chinês ficou em segundo lugar, atrás apenas do principal Gemini.

admin

Compartilhar
Publicado por
admin

Postagens recentes

Um supercomputador híbrido quântico-clássico, o Roquo, com desempenho de 19,8 petaflops, foi lançado no Japão.

O supercomputador híbrido quântico-clássico Roquo, batizado em homenagem ao Monte Rokko, ao norte de Kobe,…

45 minutos atrás

Trump ordenou a construção de um computador quântico poderoso nos Estados Unidos até 2028.

O presidente dos EUA, Donald Trump, ordenou ontem a aceleração do desenvolvimento de um computador…

45 minutos atrás

Uma referência a Tommy Vercetti, de GTA: Vice City, foi encontrada no segundo trailer de GTA VI, mais de um ano depois de seu lançamento.

Embora tenha passado mais de um ano desde a estreia do segundo trailer do ambicioso…

45 minutos atrás

No último ano fiscal, a Oracle demitiu um em cada sete funcionários, mais do que o esperado.

O impacto da inteligência artificial na Oracle, empresa tradicionalmente associada a sistemas de gerenciamento de…

1 hora atrás

A Cloudflare e os principais desenvolvedores de navegadores ensinarão os sites a distinguir humanos de bots.

A Cloudflare, juntamente com os desenvolvedores do Google Chrome, Microsoft Edge e Mozilla Firefox, anunciou…

2 horas atrás