O modelo de IA chinês de código aberto GLM-5.2 da Z.ai superou o GPT-5.5 em testes de programação.

A startup chinesa de IA, Z.ai (anteriormente Zhipu), anunciou o lançamento de seu modelo de linguagem em larga escala, GLM-5.2, com pesos de código aberto e 753 bilhões de parâmetros. Seu principal objetivo é dar suporte à programação e ao desenvolvimento com um “horizonte de planejamento de longo prazo”.

Fonte da imagem: Steve A Johnson / unsplash.com

O modelo pode ser acessado por meio de uma API nos recursos do Z.ai e na plataforma Hugging Face; mais de 20 ambientes de desenvolvimento de terceiros são suportados. O modelo oferece uma janela de contexto de 1 milhão de tokens; assinaturas corporativas começam em US$ 12,60 por mês. Os pesos principais do GLM-5.2 estão disponíveis sob a licença MIT — empresas podem baixar, personalizar e refinar o modelo gratuitamente, executando-o localmente ou em máquinas virtuais, pagando apenas pelos recursos computacionais e pela eletricidade.

Fonte da imagem: z.ai

O modelo GLM-5.2 da Z.ai possui 753 bilhões de parâmetros e implementa uma importante otimização arquitetural, o IndexShare. Ele reutiliza um único indexador em quatro camadas de atenção esparsas, reduzindo a carga computacional em 2,9 vezes, com um comprimento máximo de contexto de 1 milhão de tokens. Além disso, utiliza um esquema de predição multi-token (MTP) aprimorado que, ao executar o método de decodificação especulativa, ignora 20% mais tokens durante a inferência, economizando ainda mais recursos.

Fonte da imagem: z.ai

O modelo oferece uma escolha de “modos de raciocínio”: “Máximo” ajuda a expandir os limites da resolução lógica de problemas, enquanto “Alto” encontra um equilíbrio entre alto desempenho e eficiência na geração de tokens. No primeiro modo, ele produz uma média de 85.000 tokens por tarefa, enquanto no segundo modo, produz metade disso. Em benchmarks padrão do setor, o Z.ai GLM-5.2 superou a maioria dos principais modelos de código aberto e também apresentou desempenho próximo ou superior aos principais modelos proprietários, incluindo o OpenAI GPT-5.5 e o Anthropic Claude Opus 4.8.

Para trabalhar com o modelo, o desenvolvedor lançou o GLM Coding Plan, que se concentra na conexão com ferramentas de desenvolvimento em vez da interface tradicional de chatbot. Os aplicativos compatíveis incluem Claude Code, OpenClaw, Cline, Kilo Code, Crush e Factory. O plano Lite (US$ 12,60 por mês ou US$ 151,20 por ano, a partir do segundo ano) foi projetado para iterações simples em repositórios pequenos; O plano Pro (US$ 50,40 por mês) oferece cinco vezes mais recursos computacionais que o Lite; o plano Max (US$ 112,00 por mês) oferece 20 vezes mais recursos que o Lite e recursos dedicados durante os horários de pico. O acesso à API do GLM-5.2 custa US$ 1,40 por 1 milhão de tokens de entrada e US$ 4,40 por 1 milhão de tokens de saída.

admin

Compartilhar
Publicado por
admin

Postagens recentes

O criador de Deus Ex explicou o que aconteceu com o sofrido System Shock 3.

Warren Spector, cofundador da OtherSide Entertainment e creditado pela criação de Deus Ex e System…

30 minutos atrás

A notícia de que a tecnologia de processo 18A-P da Intel estava pronta fez com que as ações da ASML atingissem o maior patamar anual.

As ações da ASML dispararam para a máxima de 52 semanas após a Intel anunciar…

30 minutos atrás

“Nem consigo imaginar o esforço que foi necessário para tudo isso”: Fãs de Morrowind impressionados com a cidade de cogumelos de Sadrith Mora, em escala realista.

O artista 3D australiano Leo Torres criou uma renderização em escala realista da cidade cogumelo…

45 minutos atrás

As vendas globais de smartphones estão em queda pela nona semana consecutiva.

Os especialistas da Counterpoint Research consideram a queda nas vendas de smartphones tão drástica que…

1 hora atrás

Trump anunciou que a Apple e a Intel concordaram em cooperar na produção de chips nos EUA.

A Apple concordou em colaborar com a Intel no desenvolvimento e produção de processadores nos…

1 hora atrás