O Alibaba revelou o primeiro modelo de IA aberto baseado na nova arquitetura Qwen3-Next — dez vezes mais rápido que seu antecessor direto, mas com um custo de desenvolvimento dez vezes menor. Em termos de qualidade e precisão de respostas, é comparável ao carro-chefe da geração anterior.
Fonte da imagem: qwen.ai
O Alibaba Qwen3-Next-80B-A3B, com 80 bilhões de parâmetros, exigiu cerca de dez vezes menos custos de treinamento em comparação com seu antecessor, o Qwen3-32B, mas o novo modelo executa algumas tarefas dez vezes mais rápido. Em termos de precisão e qualidade de resposta, ele funciona no mesmo nível do carro-chefe Qwen3-235B-A22B; os modelos de nova geração são otimizados para implantação e operação eficientes, mesmo em hardware de consumo, afirmou o Alibaba.
A empresa também apresentou uma versão de raciocínio do modelo na mesma arquitetura. O Alibaba Qwen3-Next-80B-A3B-Thinking superou seu antecessor, o Qwen3-32B-Thinking, e o Google Gemini-2.5-Flash-Thinking, em vários parâmetros, afirmou o desenvolvedor, citando testes de terceiros.
A empresa aprimorou a eficiência do novo modelo combinando diversas técnicas, incluindo um mecanismo de “atenção híbrida”, que ajudou a simplificar o processamento de dados de texto de entrada, e uma arquitetura de “mistura altamente esparsa de especialistas” (MoE), que envolve a divisão do modelo em sub-redes especializadas em diferentes subconjuntos de dados de entrada para resolver problemas em conjunto. Outra inovação foi a estratégia de “previsão multitoken”, bem como uma série de medidas destinadas a aumentar a estabilidade do modelo durante o processo de treinamento.
O modelo Qwen3-Next-80B-A3B já está disponível na infraestrutura do Alibaba Cloud para uso via API; ele também pode ser usado nas plataformas Hugging Face e ModelScope.
A Figure AI relatou que, durante os testes, seus robôs humanoides operaram por mais de…
A Comissão Federal de Comércio dos EUA (FTC, na sigla em inglês) iniciou uma investigação…
Um overclocker chinês apelidado de "Wytiwx" estabeleceu um novo recorde mundial de overclock de CPU,…
Em uma versão de teste do Windows lançada recentemente, os desenvolvedores implementaram diversos recursos muito…
O YouTube expandiu seu programa de detecção de similaridade baseado em IA para um número…
A SpaceX, fabricante de foguetes e satélites de Elon Musk, planeja listar suas ações na…