A empresa chinesa Alibaba apresentou seu modelo de inteligência artificial Qwen3.7-Max, projetado para a era dos agentes de IA. Ele não apenas responde a perguntas; pode realizar planejamento a longo prazo, executar tarefas por horas sem intervenção humana e até mesmo controlar robôs.

Fonte da imagem: qwen.ai

Nos principais benchmarks da Alibaba, o Qwen3.7-Max teve um desempenho equivalente ao dos líderes do setor, alcançando resultados comparáveis ​​aos do DeepSeek, Kimi, GLM e Anthropic. A desenvolvedora está confiante de que os modelos chineses não estão mais correndo atrás do prejuízo, mas sim em pé de igualdade com os líderes americanos do setor. Seu trabalho não se limita a sessões de perguntas e respostas com usuários — na era dos agentes de IA, ele se sai igualmente bem em programação, trabalho com documentos do Office, pesquisa de perguntas, gerenciamento de agentes de IA subordinados e até mesmo robôs.

A Alibaba forneceu diversos exemplos de tarefas que o Qwen3.7-Max concluiu com sucesso. Em um cenário, ele passou 35 horas otimizando o kernel do software, fazendo mais de mil chamadas de ferramentas e otimizando o código para o acelerador PPU T-Head ZW-M890, ao qual não foi exposto durante o treinamento, e alcançou um aumento de desempenho de dez vezes em comparação com a implementação de referência. É importante ressaltar que o Qwen3.7-Max manteve o foco em seu objetivo e preservou sua estratégia ao longo de todo o trabalho, acumulando experiência. Como exemplo de execução de tarefas de escritório, o modelo estudou os requisitos de forma independente e adaptou o documento. A Alibaba observou que os modelos de IA às vezes tentam burlar o sistema e adaptar suas respostas a resultados conhecidos. Durante a fase de aprendizado por reforço, o Qwen3.7-Max desenvolveu a capacidade de controlar esses impulsos — ele rastreou suas próprias tentativas de enganar o sistema e gerou novas regras de proteção.

O modelo demonstrou aptidão para planejamento a longo prazo. Em uma simulação de startups do YC-Bench, alcançou uma receita de US$ 2,08 milhões, superando seus concorrentes.predecessores. Outro cenário é o controle de um robô com aparência de cachorro. O Qwen3.7-Max atuou como o elo principal na cadeia por meio da plataforma de agentes Qwen-RobotClaw, do modelo de navegação base Qwen-RobotNav e de um sistema de visão computacional baseado no modelo Qwen-plus. O Alibaba Qwen3.7-Max é compatível com aplicativos de agentes de IA como Claude Code, OpenClaw e Qwen Code; as chamadas de API são compatíveis com os formatos OpenAI e Anthropic. O novo modelo é fechado, mas já está disponível para uso na infraestrutura do Alibaba Cloud.

By admin

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *