O Alibaba revelou o primeiro modelo de IA aberto baseado na nova arquitetura Qwen3-Next — dez vezes mais rápido que seu antecessor direto, mas com um custo de desenvolvimento dez vezes menor. Em termos de qualidade e precisão de respostas, é comparável ao carro-chefe da geração anterior.

Fonte da imagem: qwen.ai

O Alibaba Qwen3-Next-80B-A3B, com 80 bilhões de parâmetros, exigiu cerca de dez vezes menos custos de treinamento em comparação com seu antecessor, o Qwen3-32B, mas o novo modelo executa algumas tarefas dez vezes mais rápido. Em termos de precisão e qualidade de resposta, ele funciona no mesmo nível do carro-chefe Qwen3-235B-A22B; os modelos de nova geração são otimizados para implantação e operação eficientes, mesmo em hardware de consumo, afirmou o Alibaba.

A empresa também apresentou uma versão de raciocínio do modelo na mesma arquitetura. O Alibaba Qwen3-Next-80B-A3B-Thinking superou seu antecessor, o Qwen3-32B-Thinking, e o Google Gemini-2.5-Flash-Thinking, em vários parâmetros, afirmou o desenvolvedor, citando testes de terceiros.

A empresa aprimorou a eficiência do novo modelo combinando diversas técnicas, incluindo um mecanismo de “atenção híbrida”, que ajudou a simplificar o processamento de dados de texto de entrada, e uma arquitetura de “mistura altamente esparsa de especialistas” (MoE), que envolve a divisão do modelo em sub-redes especializadas em diferentes subconjuntos de dados de entrada para resolver problemas em conjunto. Outra inovação foi a estratégia de “previsão multitoken”, bem como uma série de medidas destinadas a aumentar a estabilidade do modelo durante o processo de treinamento.

O modelo Qwen3-Next-80B-A3B já está disponível na infraestrutura do Alibaba Cloud para uso via API; ele também pode ser usado nas plataformas Hugging Face e ModelScope.

admin

Postagens recentes

Estatísticas do Steam em março: Linux ultrapassa macOS, popularidade da RTX 5070 volta à realidade e AMD conquista mais participação de mercado da Intel.

A pesquisa de hardware do Steam de março registrou um aumento significativo na participação de…

56 minutos atrás

Cloudflare revela o EmDash, um sucessor espiritual do WordPress.

A Cloudflare apresentou o EmDash, seu próprio sistema de gerenciamento de conteúdo (CMS), ou plataforma…

1 hora atrás

O Yandex adicionou o bloqueio de todos os números desconhecidos ao seu identificador de chamadas.

O recurso de identificação de chamadas integrado aos aplicativos Yandex foi atualizado com uma nova…

2 horas atrás

A Fujitsu vai cortar 10% de sua força de trabalho no Reino Unido em um esforço para lidar com o escândalo de longa data envolvendo a Royal Mail.

A Fujitsu anunciou sua intenção de organizar demissões "voluntárias" no Reino Unido, visando reduzir sua…

2 horas atrás

O Google começará a forçar o Wear OS a usar aplicativos de 64 bits.

Este ano, o Google está migrando o software de seu ecossistema para uma arquitetura de…

3 horas atrás

O Irã lançou mais um ataque contra um centro de dados da AWS no Bahrein.

O Irã atacou um data center no Bahrein que hospedava o AWS ME-SOUTH-1, marcando um…

3 horas atrás