Alibaba Cloud apresentou o modelo QWEN2.5-MAX AI, que excede o Deepseek V3 em testes-chave

A Alibaba Cloud, uma unidade em nuvem da empresa chinesa Alibaba, anunciou o lançamento de um modelo de idioma em larga escala atualizado QWEN2.5-MAX. O modelo de IA é baseado na arquitetura de mistura de especialistas (MOE) e treinado em mais de 20 trilhões de tokens. Os desenvolvedores enfatizam que a ferramenta mostrou “progresso significativo nas capacidades intelectuais” e já está disponível para uso.

Fonte da imagem: Alibaba Cloud

A nova versão do modelo é caracterizada por um desempenho e precisão aprimorados, é capaz de lidar melhor com tarefas que exigem uma compreensão profunda do contexto, como a análise do texto, tradução e geração de conteúdo. “O QWEN2.5-MAX demonstra progresso significativo no processamento de solicitações complexas e no fornecimento de respostas relevantes”, escreve a empresa nas páginas de seu blog.

O QWEN2.5-MAX foi testado em vários benchmarks-chave, incluindo MMLU-pro, Livecodebench, Livebench e Arena-Hard. O modelo mostrou superioridade sobre o Deepseek V3 em testes como arena, Livebench e Livecodebench, e também demonstrou resultados competitivos no MMLU-Pro. Comparado a outros modelos líderes, como o GPT-4O e o Claude-3.5, o QWEN2.5-MAX também confirmou suas posições principais.

Fonte da imagem: Alibaba Cloud

Fonte da imagem: Alibaba Cloud

A Alibaba Cloud planeja integrar o QWEN2.5-MAX em seus serviços em nuvem, o que permitirá que os clientes usem uma ferramenta para resolver uma ampla gama de problemas, incluindo a automação do processamento de dados, melhorando a interação do cliente através de bots de bate-papo e otimizando os processos de negócios.

O modelo de IA já está disponível no serviço de bate-papo QWEN, no qual os usuários podem interagir com QWEN2.5-MAX, testar seus recursos e experimentar várias funções. Para desenvolvedores, a interface de software da API também está aberta. Para acesso, você precisa se registrar no Alibaba Cloud, ativar o serviço Model Studio e criar uma chave da API.

avalanche

Postagens recentes

O módulo lunar americano da Firefly Aerospace entra em órbita lunar, com pouso previsto para março

A startup texana Firefly Aerospace, na formação e desenvolvimento da qual o empresário ucraniano Maxim…

2 minutos atrás

A Meta formou uma equipe para desenvolver robôs humanoides e investirá pesadamente nisso

A Meta✴ anunciou aos funcionários na sexta-feira que formou uma nova equipe que se concentrará…

23 minutos atrás

Cientistas criam protótipo de reator para produção gratuita de combustível a partir de CO2 atmosférico usando o Sol

Cientistas da Universidade de Cambridge, no Reino Unido, criaram uma planta para capturar dióxido de…

43 minutos atrás

Arm rouba funcionários de clientes para montar sua própria fábrica de chips

A British Arm, criadora e licenciadora da arquitetura de processador de mesmo nome, começou a…

1 hora atrás

A tecnologia inovadora para gravar cristais NAND 3D tornará o SSD tangível

Quando a tecnologia de memória NAND 3D estava no início de seu desenvolvimento, as camadas…

8 horas atrás