Categorias: Editor gráfico

A Alibaba lançou um concorrente para o Nano Banana: um poderoso gerador de imagens com IA chamado Qwen-Image-2.0.

A Alibaba anunciou o lançamento do Qwen-Image-2.0, um modelo de inteligência artificial para geração de imagens. O desenvolvedor alcançou um avanço significativo: o modelo consegue renderizar texto com precisão, permitindo ainda a escolha de diferentes estilos. Ele suporta até mil tokens e a saída pode incluir imagens fotorrealistas, imagens para apresentações, pôsteres, quadrinhos e muito mais.

Fonte da imagem: qwen.ai

A criação do modelo Qwen-Image-2.0 foi precedida por duas linhas paralelas de desenvolvimento em sistemas de IA para gráficos. A primeira consiste na geração de imagens com máxima precisão e detalhes, incluindo a renderização correta de texto. A segunda é a edição de imagens, onde funcionalidade e consistência são importantes, sem distorcer a imagem original. O projeto Qwen-Image-2.0 incorpora a fusão dessas duas linhas de pesquisa em um único modelo universal que combina as vantagens de ambas as abordagens. Ele também apresenta uma arquitetura leve, uma pegada menor e maior velocidade de inferência.

A Alibaba listou as principais vantagens do Qwen-Image-2.0. Além da precisão herdada da área de edição de imagens, o modelo é capaz de criar composições complexas graças ao suporte para consultas detalhadas de até mil tokens. Outra vantagem do Qwen-Image-2.0 é sua qualidade estética, que, em particular, ajuda o modelo a posicionar o texto harmoniosamente em relação às imagens e a selecionar o estilo de fonte apropriado. Um exemplo de realismo é a geração de uma imagem com texto em uma placa brilhante, refletindo os objetos ao redor, bem como o posicionamento harmonioso de objetos e texto em pôsteres de filmes gerados. Por fim, a organização e o alinhamento da composição permitem que o Qwen-Image-2.0 crie histórias em quadrinhos com ilustrações informativas e acompanhamento textual preciso.

A Alibaba realizou um teste cego do Qwen-Image-2.0 na plataforma AI Arena. O desenvolvedor comparou suas capacidades de geração e edição de imagens com as de outros modelos. No primeiro teste, apenas o Gemini-3-Pro-Image-Preview do Google e o OpenAI GPT Image 1.5 se mostraram mais poderosos que o Qwen-Image-2.0; no segundo teste, o modelo chinês ficou em segundo lugar, atrás apenas do principal Gemini.

admin

Compartilhar
Publicado por
admin

Postagens recentes

A Unitree lançou a primeira loja de habilidades do mundo para robôs humanoides.

A Unitree Robotics lançou a primeira loja de aplicativos do mundo para robôs humanoides. A…

22 minutos atrás

O Google vinculou o reCAPTCHA aos Serviços do Google Play, interrompendo a verificação para usuários do Android que não possuem os serviços do Google.

O Google integrou o sistema de verificação reCAPTCHA de última geração à plataforma fechada Google…

11 horas atrás

A Samsung expande sua equipe de robótica humanoide e acelera a transformação da IA.

A Samsung Electronics expandiu sua equipe de robótica do futuro e, simultaneamente, sua divisão de…

11 horas atrás

A Nvidia gastou mais de 40 bilhões de dólares na aquisição de ativos de outras empresas este ano.

Com receitas recordes em meio ao boom da IA, a Nvidia tem investido muito mais…

15 horas atrás

Foram revelados detalhes sobre os próximos processadores da Intel: Nova Lake, Razor Lake, Titan Lake e Moon Lake, que serão lançados antes de 2028.

A Intel planeja apresentar seus processadores Nova Lake no segundo semestre deste ano. Embora muito…

16 horas atrás