Alibaba Cloud apresentou o modelo QWEN2.5-MAX AI, que excede o Deepseek V3 em testes-chave

A Alibaba Cloud, uma unidade em nuvem da empresa chinesa Alibaba, anunciou o lançamento de um modelo de idioma em larga escala atualizado QWEN2.5-MAX. O modelo de IA é baseado na arquitetura de mistura de especialistas (MOE) e treinado em mais de 20 trilhões de tokens. Os desenvolvedores enfatizam que a ferramenta mostrou “progresso significativo nas capacidades intelectuais” e já está disponível para uso.

Fonte da imagem: Alibaba Cloud

A nova versão do modelo é caracterizada por um desempenho e precisão aprimorados, é capaz de lidar melhor com tarefas que exigem uma compreensão profunda do contexto, como a análise do texto, tradução e geração de conteúdo. “O QWEN2.5-MAX demonstra progresso significativo no processamento de solicitações complexas e no fornecimento de respostas relevantes”, escreve a empresa nas páginas de seu blog.

O QWEN2.5-MAX foi testado em vários benchmarks-chave, incluindo MMLU-pro, Livecodebench, Livebench e Arena-Hard. O modelo mostrou superioridade sobre o Deepseek V3 em testes como arena, Livebench e Livecodebench, e também demonstrou resultados competitivos no MMLU-Pro. Comparado a outros modelos líderes, como o GPT-4O e o Claude-3.5, o QWEN2.5-MAX também confirmou suas posições principais.

Fonte da imagem: Alibaba Cloud

Fonte da imagem: Alibaba Cloud

A Alibaba Cloud planeja integrar o QWEN2.5-MAX em seus serviços em nuvem, o que permitirá que os clientes usem uma ferramenta para resolver uma ampla gama de problemas, incluindo a automação do processamento de dados, melhorando a interação do cliente através de bots de bate-papo e otimizando os processos de negócios.

O modelo de IA já está disponível no serviço de bate-papo QWEN, no qual os usuários podem interagir com QWEN2.5-MAX, testar seus recursos e experimentar várias funções. Para desenvolvedores, a interface de software da API também está aberta. Para acesso, você precisa se registrar no Alibaba Cloud, ativar o serviço Model Studio e criar uma chave da API.

avalanche

Postagens recentes

A tecnologia inovadora para gravar cristais NAND 3D tornará o SSD tangível

Quando a tecnologia de memória NAND 3D estava no início de seu desenvolvimento, as camadas…

5 horas atrás

A Perplexity lançou uma alternativa quase gratuita para a OpenAi e Google Deep Research

A Perplexity introduziu a ferramenta de pesquisa profunda, que permite criar relatórios analíticos detalhados em…

5 horas atrás

Google desconectado em alertas do Android de terremotos no Brasil após falsa ansiedade

O Google desconectou temporariamente a função de detectar terremotos no Android no Brasil, depois que…

9 horas atrás

Western Digital e Sandisk logo se tornarão empresas independentes novamente

O comunicado de imprensa que precede a Western Digital for Investors nesta semana começou com…

9 horas atrás