Categorias: Inteligência Artificial, Aprendizado de Máquina, Redes NeuraisMercado de tecnologia e TI. notícia

Alibaba revela prévia do modelo de IA Qwen3-Max com 1 trilhão de parâmetros

A equipe de IA da Alibaba, Qwen, teve um verão produtivo, lançando diversos modelos que estão no mesmo nível, ou até melhores, dos principais laboratórios dos EUA, incluindo Google, OpenAI e Anthropic. O maior projeto foi o modelo de linguagem de grande porte Qwen3-Max-Preview (Instruct), com mais de 1 trilhão de parâmetros.

Fonte da imagem: Alibaba

Parâmetros são as configurações internas que regem o comportamento de um modelo de linguagem grande, e quanto mais parâmetros houver, mais poderoso será o modelo. Acredita-se que o OpenAI GPT-4o tenha aproximadamente o mesmo número de parâmetros, mas muitos laboratórios líderes em IA começaram recentemente a lançar modelos menores, portanto, a decisão dos autores do Qwen de aumentar esse número é digna de nota. Os resultados do benchmark Qwen-3-Max-Preview publicados pelos desenvolvedores chineses indicam que ele supera o modelo anterior da empresa, o Qwen3-235B-A22B-2507, e é um forte concorrente de outros modelos líderes do setor. Em SuperGPQA, AIME25, LiveCodeBench v6, Arena-Hard v2 e LiveBench (20241125), o novo Qwen3-Max-Preview supera consistentemente o Claude Opus 4, o Kimi K2 e o Deepseek-V3.1.

O novo modelo já está disponível no site do desenvolvedor, Qwen Chat, via API no Alibaba Cloud, nas plataformas OpenRouter e AnyCoder. Ao contrário de outros sistemas do Alibaba, o novo Qwen3-Max-Preview ainda não está disponível sob uma licença de código aberto e, para conectá-lo a aplicativos, os desenvolvedores terão que se contentar com a API paga da própria empresa ou de seus parceiros. Na prática, o modelo falha com menos frequência em tarefas complexas como, por exemplo, comparar números idênticos ou contar o número de letras especificadas em uma determinada palavra – nem todas as IAs modernas são capazes disso ainda. Na plataforma Qwen Chat, ele também funciona mais rápido que o ChatGPT.

Fonte da imagem: Alibaba

O Alibaba Qwen3-Max-Preview suporta uma janela de contexto de 262.144 tokens, um tamanho máximo de solicitação de 258.048 tokens e um comprimento máximo de resposta de 32.768 tokens. Ele suporta cache de contexto, o que ajuda a otimizar o desempenho durante sessões longas. O modelo foi projetado para raciocínio complexo (embora o modo Thinking ainda não esteja disponível no Qwen Chat), escrita de código, processamento de formatos de dados estruturados, incluindo JSON, e tarefas criativas. É igualmente eficaz em conversas sobre diversos tópicos e como um agente; pode ser usado por clientes corporativos e laboratórios de pesquisa.

O custo de usar o Alibaba Qwen3-Max-Preview por meio da API do Alibaba Cloud depende do número de tokens:

O anúncio do Alibaba Qwen3-Max-Preview causou uma onda de reações nas redes sociais. Os criadores do projeto observaram que haviam escalado o modelo de IA para 1 trilhão de parâmetros e que o trabalho estava em andamento; na verdade, eles planejavam lançar algo novo na próxima semana. Algumas das limitações no comprimento do contexto se deviam à interface de bate-papo, e não ao modelo em si, acrescentaram, e um modo de raciocínio para ele já estava “em desenvolvimento”. Os primeiros usuários do modelo expressaram satisfação com os resultados obtidos nos testes iniciais; alguns estavam curiosos para ver como ele lidaria com problemas que exigissem raciocínio lógico complexo.

Fonte da imagem: x.com/_akhaliq

A pedido de Ahsen Khaliq, chefe de desenvolvimento de aprendizado de máquina, o modelo Qwen3-Max-Preview do Alibaba construiu uma imagem voxel na plataforma AnyCoder – um modelo de um jardim no estilo Minecraft. Ele, como outros experimentadores observaram, lidou com os problemas aritméticos propostos, resolveu o “quebra-cabeça 24” matemático e até mesmo uma tarefa específica que pesos pesados como o OpenAI GPT-5 e o Google Gemini 2.5 Pro não conseguiram enfrentar. Ao receber uma solicitação complexa, ele, como mostram as observações, muda para um modo semelhante ao raciocínio, no qual cria respostas estruturadas passo a passo.

Para clientes corporativos, o valor do Qwen3-Max-Preview será determinado não por benchmarks, mas por como ele lida com tarefas específicas na prática. Com um trilhão de parâmetros, ele requer ajustes finos menos constantes quando implantado em aplicativos, mas o sistema de preços em camadas pode ser um impedimento para clientes corporativos. Seus pontos fortes incluem a similaridade da API com o OpenAI e o suporte a cache. Vale ressaltar que o Qwen3-Max-Preview, como o nome sugere, ainda é uma versão preliminar do modelo, e sua implantação às pressas pode estar associada a riscos.

Os desenvolvedores do laboratório Qwen do Alibaba também enfatizaram que esta ainda não é a versão final do modelo — sua versão disponível ao público provavelmente apresentará indicadores ainda mais impressionantes. Isso fortalecerá a posição do Qwen no ambiente de modelos de linguagem supergrandes.

admin

Próximo O primeiro supercomputador exascale da Europa, Júpiter, apareceu e ficou em quarto lugar no mundo »

Anterior « Logitech se prepara para lançar o teclado analógico MX Keys S movido a energia solar

Deixar comentário

Publicado por

admin

7 meses atrás

Postagens recentes

Redes e comunicações

As comunicações ópticas sem fio em ambientes internos estabelecem novos recordes de velocidade e eficiência.

Os proverbiais "chapéus de alumínio" não serão mais necessários para quem se preocupa com a…

31 minutos atrás

Notícias da rede

O suporte técnico da NASA reparou remotamente o Microsoft Outlook no tablet do comandante da missão lunar Artemis II.

Durante o lançamento da espaçonave Orion a bordo do foguete SLS rumo à Lua, no…

2 horas atrás

Vírus, cavalos de Troia, vulnerabilidades de software, problemas de segurança

A Perplexity está sendo processada por compartilhar secretamente dados pessoais e comunicações de usuários com anunciantes.

Uma ação coletiva foi movida contra a desenvolvedora do Perplexity por uma violação massiva de…

2 horas atrás

Inteligência Artificial, Aprendizado de Máquina, Redes Neurais

A Anthropic introduziu uma taxa adicional para conectar o OpenClaw ao Claude.

A Anthropic alterou sua política de serviços. A conexão do agente de IA OpenClaw à…

2 horas atrás

Notícias da rede

Um tribunal ordenou que a Netflix reembolse o dinheiro referente a aumentos injustificados nos preços das assinaturas, mas apenas em um país.

Enquanto os assinantes da Netflix nos EUA ainda se recuperam do último aumento de preços,…

2 horas atrás

Computadores e laptops Apple

A Apple esgotou todos os Mac Studios com 256 GB de RAM, e o prazo de entrega pode chegar a 4-5 meses.

A Apple normalmente não vende produtos para o consumidor final que demorem meses para serem…

3 horas atrás

Alibaba revela prévia do modelo de IA Qwen3-Max com 1 trilhão de parâmetros

Conteúdo relacionado

Postagens recentes

As comunicações ópticas sem fio em ambientes internos estabelecem novos recordes de velocidade e eficiência.

O suporte técnico da NASA reparou remotamente o Microsoft Outlook no tablet do comandante da missão lunar Artemis II.

A Perplexity está sendo processada por compartilhar secretamente dados pessoais e comunicações de usuários com anunciantes.

A Anthropic introduziu uma taxa adicional para conectar o OpenClaw ao Claude.

Um tribunal ordenou que a Netflix reembolse o dinheiro referente a aumentos injustificados nos preços das assinaturas, mas apenas em um país.

A Apple esgotou todos os Mac Studios com 256 GB de RAM, e o prazo de entrega pode chegar a 4-5 meses.