A Alibaba Cloud, uma unidade em nuvem da empresa chinesa Alibaba, anunciou o lançamento de um modelo de idioma em larga escala atualizado QWEN2.5-MAX. O modelo de IA é baseado na arquitetura de mistura de especialistas (MOE) e treinado em mais de 20 trilhões de tokens. Os desenvolvedores enfatizam que a ferramenta mostrou “progresso significativo nas capacidades intelectuais” e já está disponível para uso.
Fonte da imagem: Alibaba Cloud
A nova versão do modelo é caracterizada por um desempenho e precisão aprimorados, é capaz de lidar melhor com tarefas que exigem uma compreensão profunda do contexto, como a análise do texto, tradução e geração de conteúdo. “O QWEN2.5-MAX demonstra progresso significativo no processamento de solicitações complexas e no fornecimento de respostas relevantes”, escreve a empresa nas páginas de seu blog.
O QWEN2.5-MAX foi testado em vários benchmarks-chave, incluindo MMLU-pro, Livecodebench, Livebench e Arena-Hard. O modelo mostrou superioridade sobre o Deepseek V3 em testes como arena, Livebench e Livecodebench, e também demonstrou resultados competitivos no MMLU-Pro. Comparado a outros modelos líderes, como o GPT-4O e o Claude-3.5, o QWEN2.5-MAX também confirmou suas posições principais.
Fonte da imagem: Alibaba Cloud
Fonte da imagem: Alibaba Cloud
A Alibaba Cloud planeja integrar o QWEN2.5-MAX em seus serviços em nuvem, o que permitirá que os clientes usem uma ferramenta para resolver uma ampla gama de problemas, incluindo a automação do processamento de dados, melhorando a interação do cliente através de bots de bate-papo e otimizando os processos de negócios.
O modelo de IA já está disponível no serviço de bate-papo QWEN, no qual os usuários podem interagir com QWEN2.5-MAX, testar seus recursos e experimentar várias funções. Para desenvolvedores, a interface de software da API também está aberta. Para acesso, você precisa se registrar no Alibaba Cloud, ativar o serviço Model Studio e criar uma chave da API.
A startup texana Firefly Aerospace, na formação e desenvolvimento da qual o empresário ucraniano Maxim…
A Meta✴ anunciou aos funcionários na sexta-feira que formou uma nova equipe que se concentrará…
Cientistas da Universidade de Cambridge, no Reino Unido, criaram uma planta para capturar dióxido de…
A British Arm, criadora e licenciadora da arquitetura de processador de mesmo nome, começou a…
Um dos usuários do fórum Reddit compartilhou imagens da placa de vídeo Gigabyte Radeon RX…
Quando a tecnologia de memória NAND 3D estava no início de seu desenvolvimento, as camadas…