A empresa chinesa Alibaba Group Holding revelou o QwQ-32B, um modelo de inteligência artificial (IA) de código aberto com recursos de raciocínio que, segundo ela, supera o DeepSeek R1 em diversas áreas, usando muito menos recursos.

Fonte da imagem: Alibaba Group Holding

Após o anúncio, as ações do Alibaba subiram 7,5% nas negociações de Hong Kong, seu maior ganho intradiário em quase duas semanas.

O novo modelo de IA do Alibaba tem 32 bilhões de parâmetros e supera os 671 bilhões de parâmetros do DeepSeek R1 em áreas como cálculos matemáticos, escrita de código de programação e resolução de questões gerais. A equipe diz que o menor número de parâmetros permite que o modelo opere com menores demandas computacionais, o que facilitará sua adoção mais ampla. Para melhorar o desempenho do modelo de raciocínio, os desenvolvedores usaram aprendizado por reforço. A DeepSeek usou uma abordagem semelhante ao desenvolver o modelo R1. O Alibaba também afirmou que o QwQ-32B supera o modelo o1-mini da OpenAI com 100 bilhões de parâmetros.

O QwQ-32B está disponível no Hugging Face, a maior plataforma de modelos de IA de código aberto do mundo. Você também pode testar seu funcionamento através do chatbot Qwen. Lá ele é apresentado na lista de modelos sob o nome QwQ-32B-Preview.

O Alibaba anunciou anteriormente planos de investir mais de 380 bilhões de yuans (US$ 52 bilhões) em computação em nuvem e infraestrutura de IA nos próximos três anos, o maior projeto de IA já financiado por uma única empresa privada na China. O CEO do Alibaba, Eddie Wu, disse que o principal objetivo da empresa é desenvolver Inteligência Artificial Geral (AGI), que ele definiu como o ponto em que a IA pode atingir 80% das capacidades humanas.

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *