Categorias: Editor gráfico

A Alibaba lançou um concorrente para o Nano Banana: um poderoso gerador de imagens com IA chamado Qwen-Image-2.0.

A Alibaba anunciou o lançamento do Qwen-Image-2.0, um modelo de inteligência artificial para geração de imagens. O desenvolvedor alcançou um avanço significativo: o modelo consegue renderizar texto com precisão, permitindo ainda a escolha de diferentes estilos. Ele suporta até mil tokens e a saída pode incluir imagens fotorrealistas, imagens para apresentações, pôsteres, quadrinhos e muito mais.

Fonte da imagem: qwen.ai

A criação do modelo Qwen-Image-2.0 foi precedida por duas linhas paralelas de desenvolvimento em sistemas de IA para gráficos. A primeira consiste na geração de imagens com máxima precisão e detalhes, incluindo a renderização correta de texto. A segunda é a edição de imagens, onde funcionalidade e consistência são importantes, sem distorcer a imagem original. O projeto Qwen-Image-2.0 incorpora a fusão dessas duas linhas de pesquisa em um único modelo universal que combina as vantagens de ambas as abordagens. Ele também apresenta uma arquitetura leve, uma pegada menor e maior velocidade de inferência.

A Alibaba listou as principais vantagens do Qwen-Image-2.0. Além da precisão herdada da área de edição de imagens, o modelo é capaz de criar composições complexas graças ao suporte para consultas detalhadas de até mil tokens. Outra vantagem do Qwen-Image-2.0 é sua qualidade estética, que, em particular, ajuda o modelo a posicionar o texto harmoniosamente em relação às imagens e a selecionar o estilo de fonte apropriado. Um exemplo de realismo é a geração de uma imagem com texto em uma placa brilhante, refletindo os objetos ao redor, bem como o posicionamento harmonioso de objetos e texto em pôsteres de filmes gerados. Por fim, a organização e o alinhamento da composição permitem que o Qwen-Image-2.0 crie histórias em quadrinhos com ilustrações informativas e acompanhamento textual preciso.

A Alibaba realizou um teste cego do Qwen-Image-2.0 na plataforma AI Arena. O desenvolvedor comparou suas capacidades de geração e edição de imagens com as de outros modelos. No primeiro teste, apenas o Gemini-3-Pro-Image-Preview do Google e o OpenAI GPT Image 1.5 se mostraram mais poderosos que o Qwen-Image-2.0; no segundo teste, o modelo chinês ficou em segundo lugar, atrás apenas do principal Gemini.

admin

Compartilhar
Publicado por
admin

Postagens recentes

IA na Vigia: As Perspectivas dos Data Centers Orbitais / Inteligência Artificial

No entanto, nem todos os especialistas estão dispostos a ver o espaço próximo como um…

2 horas atrás

O novo assistente de IA da Adobe pode usar os aplicativos da Creative Cloud para executar tarefas.

Em outubro passado, a Adobe, como parte do Projeto Moonlight, apresentou um assistente de IA…

2 horas atrás

Invocação de criaturas, talismãs e novas armas épicas: uma grande atualização chegou para Titan Quest 2.

A editora THQ Nordic e os desenvolvedores do estúdio alemão Grimlore Games anunciaram o lançamento…

3 horas atrás

Invocação de criaturas, talismãs e novas armas épicas: uma grande atualização chegou para Titan Quest 2.

A editora THQ Nordic e os desenvolvedores do estúdio alemão Grimlore Games anunciaram o lançamento…

3 horas atrás

O Google lançou o aplicativo Gemini para macOS.

O Google lançou um aplicativo Gemini completo para computadores com o sistema operacional macOS da…

3 horas atrás

Cientistas chineses fizeram uma descoberta inovadora na gravação holográfica ultradensa.

Apesar das perspectivas promissoras, a gravação holográfica ainda não alcançou sucesso comercial. Gravar e decodificar…

3 horas atrás