Categorias: Editor gráfico

A Alibaba lançou um concorrente para o Nano Banana: um poderoso gerador de imagens com IA chamado Qwen-Image-2.0.

A Alibaba anunciou o lançamento do Qwen-Image-2.0, um modelo de inteligência artificial para geração de imagens. O desenvolvedor alcançou um avanço significativo: o modelo consegue renderizar texto com precisão, permitindo ainda a escolha de diferentes estilos. Ele suporta até mil tokens e a saída pode incluir imagens fotorrealistas, imagens para apresentações, pôsteres, quadrinhos e muito mais.

Fonte da imagem: qwen.ai

A criação do modelo Qwen-Image-2.0 foi precedida por duas linhas paralelas de desenvolvimento em sistemas de IA para gráficos. A primeira consiste na geração de imagens com máxima precisão e detalhes, incluindo a renderização correta de texto. A segunda é a edição de imagens, onde funcionalidade e consistência são importantes, sem distorcer a imagem original. O projeto Qwen-Image-2.0 incorpora a fusão dessas duas linhas de pesquisa em um único modelo universal que combina as vantagens de ambas as abordagens. Ele também apresenta uma arquitetura leve, uma pegada menor e maior velocidade de inferência.

A Alibaba listou as principais vantagens do Qwen-Image-2.0. Além da precisão herdada da área de edição de imagens, o modelo é capaz de criar composições complexas graças ao suporte para consultas detalhadas de até mil tokens. Outra vantagem do Qwen-Image-2.0 é sua qualidade estética, que, em particular, ajuda o modelo a posicionar o texto harmoniosamente em relação às imagens e a selecionar o estilo de fonte apropriado. Um exemplo de realismo é a geração de uma imagem com texto em uma placa brilhante, refletindo os objetos ao redor, bem como o posicionamento harmonioso de objetos e texto em pôsteres de filmes gerados. Por fim, a organização e o alinhamento da composição permitem que o Qwen-Image-2.0 crie histórias em quadrinhos com ilustrações informativas e acompanhamento textual preciso.

A Alibaba realizou um teste cego do Qwen-Image-2.0 na plataforma AI Arena. O desenvolvedor comparou suas capacidades de geração e edição de imagens com as de outros modelos. No primeiro teste, apenas o Gemini-3-Pro-Image-Preview do Google e o OpenAI GPT Image 1.5 se mostraram mais poderosos que o Qwen-Image-2.0; no segundo teste, o modelo chinês ficou em segundo lugar, atrás apenas do principal Gemini.

admin

Compartilhar
Publicado por
admin

Postagens recentes

O YouTube tem bombardeado alguns usuários com testes CAPTCHA antes de assistirem aos vídeos.

Alguns usuários do YouTube têm encontrado dificuldades ao usar o site devido a um CAPTCHA…

4 horas atrás

A Nvidia lançou uma atualização de driver para corrigir travamentos em Arknights: Endfield.

A Nvidia lançou a versão 596.02 do driver de correção (hotfix). Ela é baseada no…

5 horas atrás

Um horror ancestral desperta no trailer de jogabilidade de Cthulhu: The Cosmic Abyss, um jogo de terror e investigação baseado nas obras de H.P. Lovecraft.

A desenvolvedora Big Bad Wolf, com o apoio da Nacon, revelou um trailer de jogabilidade…

6 horas atrás

A MaxSun apresentou suas variantes do Arc Pro B70, com resfriamento ativo e passivo.

A MaxSun tornou-se a primeira parceira da Intel a anunciar suas variantes da placa gráfica…

7 horas atrás

A ASRock apresentou a placa-mãe Z890 Taichi 10th Anniversary com um design atualizado.

A ASRock apresentou a placa-mãe Z890 Taichi 10th Anniversary, projetada para celebrar o 10º aniversário…

8 horas atrás