Alibaba Cloud apresentou o modelo QWEN2.5-MAX AI, que excede o Deepseek V3 em testes-chave

A Alibaba Cloud, uma unidade em nuvem da empresa chinesa Alibaba, anunciou o lançamento de um modelo de idioma em larga escala atualizado QWEN2.5-MAX. O modelo de IA é baseado na arquitetura de mistura de especialistas (MOE) e treinado em mais de 20 trilhões de tokens. Os desenvolvedores enfatizam que a ferramenta mostrou “progresso significativo nas capacidades intelectuais” e já está disponível para uso.

Fonte da imagem: Alibaba Cloud

A nova versão do modelo é caracterizada por um desempenho e precisão aprimorados, é capaz de lidar melhor com tarefas que exigem uma compreensão profunda do contexto, como a análise do texto, tradução e geração de conteúdo. “O QWEN2.5-MAX demonstra progresso significativo no processamento de solicitações complexas e no fornecimento de respostas relevantes”, escreve a empresa nas páginas de seu blog.

O QWEN2.5-MAX foi testado em vários benchmarks-chave, incluindo MMLU-pro, Livecodebench, Livebench e Arena-Hard. O modelo mostrou superioridade sobre o Deepseek V3 em testes como arena, Livebench e Livecodebench, e também demonstrou resultados competitivos no MMLU-Pro. Comparado a outros modelos líderes, como o GPT-4O e o Claude-3.5, o QWEN2.5-MAX também confirmou suas posições principais.

Fonte da imagem: Alibaba Cloud

Fonte da imagem: Alibaba Cloud

A Alibaba Cloud planeja integrar o QWEN2.5-MAX em seus serviços em nuvem, o que permitirá que os clientes usem uma ferramenta para resolver uma ampla gama de problemas, incluindo a automação do processamento de dados, melhorando a interação do cliente através de bots de bate-papo e otimizando os processos de negócios.

O modelo de IA já está disponível no serviço de bate-papo QWEN, no qual os usuários podem interagir com QWEN2.5-MAX, testar seus recursos e experimentar várias funções. Para desenvolvedores, a interface de software da API também está aberta. Para acesso, você precisa se registrar no Alibaba Cloud, ativar o serviço Model Studio e criar uma chave da API.

avalanche

Postagens recentes

O MIT criou um chip de navegação com o mesmo consumo de energia de um LED para pequenos drones e óculos de realidade aumentada.

Engenheiros do Instituto de Tecnologia de Massachusetts (MIT) apresentaram um chip especializado, o Gleanmer, que…

2 horas atrás

Foram divulgadas as primeiras análises do console portátil MSI Claw 8 EX AI+ com Intel Arc G3: rápido, mas muito caro.

Analistas independentes publicaram seus primeiros testes do novo console portátil para jogos MSI Claw 8…

5 horas atrás

Nada revelará o smartphone Phone (4b) em 7 de julho.

Nada foi confirmado se o primeiro smartphone da série "(b)" será de fato lançado com…

5 horas atrás

O brutal jogo de estratégia medieval Stronghold 4 recebeu uma demo gratuita no Steam.

O estúdio britânico Firefly, pertencente à Devolver Digital, anunciou o lançamento de uma demo prometida…

6 horas atrás