O Alibaba revelou uma nova geração de IA que facilitará muito a criação e edição de imagens com base em texto e materiais visuais. O modelo, chamado Qwen VLo, fará parte de uma série de serviços de IA sob a marca Qwen e permitirá não apenas gerar imagens com base em consultas de texto, mas também modificar imagens existentes.

Fonte da imagem: Copiloto

Conforme relata a Bloomberg, o novo modelo não apenas analisa dados, mas também é capaz de gerar imagens de alta qualidade com base neles. Por exemplo, um usuário pode inserir uma consulta de texto e, após a geração, solicitar a adição de alguns detalhes, como um chapéu para um gato. Também é possível carregar uma imagem pronta e “finalizá-la”.

Um dos principais recursos do Qwen VLo é sua tecnologia de geração progressiva, que permite ao usuário acompanhar o processo de criação de uma imagem passo a passo. Por exemplo, você pode enviar uma solicitação “Criar uma imagem de um gato fofo” e o sistema começará a formar uma imagem diante dos seus olhos.

Em seu blog, a empresa também observou que a nova versão do modelo não apenas “percebe o mundo ao seu redor, mas também é capaz de criar reconstruções de alta qualidade com base nessa percepção”. Isso é consistente com o fato de que o CEO da empresa, Eddie Wu, afirmou anteriormente que o principal objetivo do Alibaba no momento é desenvolver inteligência artificial (AGI), que terá o mesmo nível de desenvolvimento humano.

O Qwen VLo se posiciona como uma resposta competitiva a outras soluções no mercado, incluindo o OpenAI. No entanto, o Alibaba também enfrenta uma concorrência agressiva dentro da China, como a DeepSeek, que causou impacto no setor ao afirmar ter construído um modelo poderoso por apenas alguns milhões de dólares. Em resposta, o Alibaba tem sido ainda mais agressivo na adição de novos recursos para processamento de texto, imagens, áudio e vídeo, além de otimizar o modelo para smartphones.

admin

Postagens recentes

Tesla não inicia vendas na Índia – apenas 600 pedidos em 2,5 meses

A tão aguardada entrada da Tesla no mercado indiano ficou aquém das expectativas até agora,…

20 minutos atrás

Dolby Vision 2 apresentado – HDR “cinematográfico”, anti-aliasing autêntico e otimizações de IA

Dez anos após o lançamento do formato Dolby Vision, uma versão atualizada do padrão, o…

29 minutos atrás

Os computadores quânticos ainda não estão prontos, mas milhões já estão sendo investidos em software para eles

Durante décadas, os esforços dos desenvolvedores de computação quântica se concentraram principalmente na criação de…

37 minutos atrás

Uma placa ASRock destruiu dois Ryzen 7 9800X3Ds em apenas alguns meses

O usuário do Reddit RedYourDead relatou que sua placa-mãe ASRock estragou duas CPUs AMD Ryzen…

1 hora atrás

Rumor: Ubisoft começou a fazer planos para Rayman 4, e Beyond Good and Evil 2 será lançado antes do final de 2027

O insider de confiança Tom Henderson compartilhou detalhes do futuro Rayman, que atualmente está sendo…

2 horas atrás