A empresa chinesa Alibaba Group Holding revelou o QwQ-32B, um modelo de inteligência artificial (IA) de código aberto com recursos de raciocínio que, segundo ela, supera o DeepSeek R1 em diversas áreas, usando muito menos recursos.

Fonte da imagem: Alibaba Group Holding

Após o anúncio, as ações do Alibaba subiram 7,5% nas negociações de Hong Kong, seu maior ganho intradiário em quase duas semanas.

O novo modelo de IA do Alibaba tem 32 bilhões de parâmetros e supera os 671 bilhões de parâmetros do DeepSeek R1 em áreas como cálculos matemáticos, escrita de código de programação e resolução de questões gerais. A equipe diz que o menor número de parâmetros permite que o modelo opere com menores demandas computacionais, o que facilitará sua adoção mais ampla. Para melhorar o desempenho do modelo de raciocínio, os desenvolvedores usaram aprendizado por reforço. A DeepSeek usou uma abordagem semelhante ao desenvolver o modelo R1. O Alibaba também afirmou que o QwQ-32B supera o modelo o1-mini da OpenAI com 100 bilhões de parâmetros.

O QwQ-32B está disponível no Hugging Face, a maior plataforma de modelos de IA de código aberto do mundo. Você também pode testar seu funcionamento através do chatbot Qwen. Lá ele é apresentado na lista de modelos sob o nome QwQ-32B-Preview.

O Alibaba anunciou anteriormente planos de investir mais de 380 bilhões de yuans (US$ 52 bilhões) em computação em nuvem e infraestrutura de IA nos próximos três anos, o maior projeto de IA já financiado por uma única empresa privada na China. O CEO do Alibaba, Eddie Wu, disse que o principal objetivo da empresa é desenvolver Inteligência Artificial Geral (AGI), que ele definiu como o ponto em que a IA pode atingir 80% das capacidades humanas.

avalanche

Postagens recentes

A Cloudflare declarou guerra aos bots de IA – eles agora serão bloqueados por padrão.

A Cloudflare anunciou planos para bloquear automaticamente bots web de propósito misto que indexam sites…

2 horas atrás

Nos vemos em agosto: Starship aciona todos os seis motores em preparação para seu 13º voo de teste.

No centro de testes Starbase, no Texas, a SpaceX realizou um teste estático de ignição…

2 horas atrás

A Meta lançou discretamente o Pocket, um aplicativo móvel para jogos de programação com foco na experiência do usuário, para serem jogados em qualquer lugar.

A chamada programação intuitiva é usada não apenas para escrever código para projetos grandes e…

2 horas atrás

A Sony já encontrou uma nova utilidade para a fábrica onde os discos do PlayStation são produzidos.

A Sony anunciou recentemente que deixará de produzir discos ópticos com seus jogos a partir…

3 horas atrás

A Meta investiu bilhões em IA, mas Zuckerberg admitiu que os agentes demoram a ficar mais inteligentes.

O ritmo de desenvolvimento de agentes de inteligência artificial "não acelerou tanto" quanto o esperado…

3 horas atrás