O Alibaba revelou uma nova geração de IA que facilitará muito a criação e edição de imagens com base em texto e materiais visuais. O modelo, chamado Qwen VLo, fará parte de uma série de serviços de IA sob a marca Qwen e permitirá não apenas gerar imagens com base em consultas de texto, mas também modificar imagens existentes.

Fonte da imagem: Copiloto

Conforme relata a Bloomberg, o novo modelo não apenas analisa dados, mas também é capaz de gerar imagens de alta qualidade com base neles. Por exemplo, um usuário pode inserir uma consulta de texto e, após a geração, solicitar a adição de alguns detalhes, como um chapéu para um gato. Também é possível carregar uma imagem pronta e “finalizá-la”.

Um dos principais recursos do Qwen VLo é sua tecnologia de geração progressiva, que permite ao usuário acompanhar o processo de criação de uma imagem passo a passo. Por exemplo, você pode enviar uma solicitação “Criar uma imagem de um gato fofo” e o sistema começará a formar uma imagem diante dos seus olhos.

Em seu blog, a empresa também observou que a nova versão do modelo não apenas “percebe o mundo ao seu redor, mas também é capaz de criar reconstruções de alta qualidade com base nessa percepção”. Isso é consistente com o fato de que o CEO da empresa, Eddie Wu, afirmou anteriormente que o principal objetivo do Alibaba no momento é desenvolver inteligência artificial (AGI), que terá o mesmo nível de desenvolvimento humano.

O Qwen VLo se posiciona como uma resposta competitiva a outras soluções no mercado, incluindo o OpenAI. No entanto, o Alibaba também enfrenta uma concorrência agressiva dentro da China, como a DeepSeek, que causou impacto no setor ao afirmar ter construído um modelo poderoso por apenas alguns milhões de dólares. Em resposta, o Alibaba tem sido ainda mais agressivo na adição de novos recursos para processamento de texto, imagens, áudio e vídeo, além de otimizar o modelo para smartphones.

admin

Postagens recentes

Conforme as cartas forem lançadas, conforme a rede ditar: a AWS está implementando uma arquitetura de rede RNG quase aleatória em seus data centers.

A AWS publicou uma descrição técnica da arquitetura de rede de data center que implementará…

14 horas atrás

O chefe da NASA afirma que os voos do foguete New Glenn não serão retomados antes de 2028, eliminando a Blue Origin da corrida lunar.

Durante um teste estático de ignição em 29 de maio de 2026, o foguete New…

14 horas atrás

Foi anunciado o sucessor espiritual de Zeus: Master of Olympus – o jogo de estratégia de construção de cidades Theos: Cities of Myth, onde história e mito se entrelaçam.

A editora Dotemu (Ninja Gaiden: Ragebound, Marvel Cosmic Invasion) e a Triskell Interactive, desenvolvedora de…

14 horas atrás

Plataforma de referência de IA Qualcomm Dragonwing IQ10 para robótica é apresentada.

Cristiano Amon, CEO da Qualcomm, apresentou a plataforma robótica Dragonwing IQ10 atualizada na Computex 2026.…

15 horas atrás

O RPG infernal baseado em turnos, Entropy, do criador de Dread Delusion, recebeu uma demo e uma data de lançamento no Acesso Antecipado do Steam.

A editora DreadXP e o estúdio britânico Lovely Hellplace (Dread Delusion) anunciaram a data de…

15 horas atrás