O Alibaba revelou uma nova geração de IA que facilitará muito a criação e edição de imagens com base em texto e materiais visuais. O modelo, chamado Qwen VLo, fará parte de uma série de serviços de IA sob a marca Qwen e permitirá não apenas gerar imagens com base em consultas de texto, mas também modificar imagens existentes.

Fonte da imagem: Copiloto

Conforme relata a Bloomberg, o novo modelo não apenas analisa dados, mas também é capaz de gerar imagens de alta qualidade com base neles. Por exemplo, um usuário pode inserir uma consulta de texto e, após a geração, solicitar a adição de alguns detalhes, como um chapéu para um gato. Também é possível carregar uma imagem pronta e “finalizá-la”.

Um dos principais recursos do Qwen VLo é sua tecnologia de geração progressiva, que permite ao usuário acompanhar o processo de criação de uma imagem passo a passo. Por exemplo, você pode enviar uma solicitação “Criar uma imagem de um gato fofo” e o sistema começará a formar uma imagem diante dos seus olhos.

Em seu blog, a empresa também observou que a nova versão do modelo não apenas “percebe o mundo ao seu redor, mas também é capaz de criar reconstruções de alta qualidade com base nessa percepção”. Isso é consistente com o fato de que o CEO da empresa, Eddie Wu, afirmou anteriormente que o principal objetivo do Alibaba no momento é desenvolver inteligência artificial (AGI), que terá o mesmo nível de desenvolvimento humano.

O Qwen VLo se posiciona como uma resposta competitiva a outras soluções no mercado, incluindo o OpenAI. No entanto, o Alibaba também enfrenta uma concorrência agressiva dentro da China, como a DeepSeek, que causou impacto no setor ao afirmar ter construído um modelo poderoso por apenas alguns milhões de dólares. Em resposta, o Alibaba tem sido ainda mais agressivo na adição de novos recursos para processamento de texto, imagens, áudio e vídeo, além de otimizar o modelo para smartphones.

admin

Postagens recentes

Imagens de alta qualidade do Samsung Galaxy S26 e S26+ vazaram online antes do anúncio.

A Samsung está se preparando para apresentar uma nova série de smartphones, incluindo o Galaxy…

12 horas atrás

Arknights: Endfield – E se Satisfactory fosse um gacha chinês? Análise / Jogos

Processador Intel Core i5-9400F de 2,9 GHz ou equivalente AMD, 16 GB de RAM, placa…

14 horas atrás

Arknights: Endfield – E se Satisfactory fosse um gacha chinês? Análise.

Intel Core i5-9400F 2.9 GHz ou equivalente AMD, 16 GB de RAM, placa de vídeo…

14 horas atrás

As neonuvens estão absorvendo dados de IA como buracos negros, alterando o comportamento da rede.

A Backblaze, provedora de armazenamento em nuvem, publicou seu relatório de Estatísticas de Rede do…

16 horas atrás

Editoras musicais processaram a Anthropic em US$ 3 bilhões por “pirataria descarada”.

Um grupo de editoras musicais, liderado pela Concord Music Group e pela Universal Music Group…

17 horas atrás

Os finlandeses começaram a fabricar cerveja “na areia” — uma cervejaria local instalou um acumulador de calor na areia.

A empresa finlandesa TheStorage lançou seu primeiro sistema industrial de armazenamento de calor à base…

17 horas atrás