A startup chinesa de IA, Z.ai (anteriormente Zhipu), anunciou o lançamento de seu modelo de linguagem em larga escala, GLM-5.2, com pesos de código aberto e 753 bilhões de parâmetros. Seu principal objetivo é dar suporte à programação e ao desenvolvimento com um “horizonte de planejamento de longo prazo”.
Fonte da imagem: Steve A Johnson / unsplash.com
O modelo pode ser acessado por meio de uma API nos recursos do Z.ai e na plataforma Hugging Face; mais de 20 ambientes de desenvolvimento de terceiros são suportados. O modelo oferece uma janela de contexto de 1 milhão de tokens; assinaturas corporativas começam em US$ 12,60 por mês. Os pesos principais do GLM-5.2 estão disponíveis sob a licença MIT — empresas podem baixar, personalizar e refinar o modelo gratuitamente, executando-o localmente ou em máquinas virtuais, pagando apenas pelos recursos computacionais e pela eletricidade.
Fonte da imagem: z.ai
O modelo GLM-5.2 da Z.ai possui 753 bilhões de parâmetros e implementa uma importante otimização arquitetural, o IndexShare. Ele reutiliza um único indexador em quatro camadas de atenção esparsas, reduzindo a carga computacional em 2,9 vezes, com um comprimento máximo de contexto de 1 milhão de tokens. Além disso, utiliza um esquema de predição multi-token (MTP) aprimorado que, ao executar o método de decodificação especulativa, ignora 20% mais tokens durante a inferência, economizando ainda mais recursos.
Fonte da imagem: z.ai
O modelo oferece uma escolha de “modos de raciocínio”: “Máximo” ajuda a expandir os limites da resolução lógica de problemas, enquanto “Alto” encontra um equilíbrio entre alto desempenho e eficiência na geração de tokens. No primeiro modo, ele produz uma média de 85.000 tokens por tarefa, enquanto no segundo modo, produz metade disso. Em benchmarks padrão do setor, o Z.ai GLM-5.2 superou a maioria dos principais modelos de código aberto e também apresentou desempenho próximo ou superior aos principais modelos proprietários, incluindo o OpenAI GPT-5.5 e o Anthropic Claude Opus 4.8.
Para trabalhar com o modelo, o desenvolvedor lançou o GLM Coding Plan, que se concentra na conexão com ferramentas de desenvolvimento em vez da interface tradicional de chatbot. Os aplicativos compatíveis incluem Claude Code, OpenClaw, Cline, Kilo Code, Crush e Factory. O plano Lite (US$ 12,60 por mês ou US$ 151,20 por ano, a partir do segundo ano) foi projetado para iterações simples em repositórios pequenos; O plano Pro (US$ 50,40 por mês) oferece cinco vezes mais recursos computacionais que o Lite; o plano Max (US$ 112,00 por mês) oferece 20 vezes mais recursos que o Lite e recursos dedicados durante os horários de pico. O acesso à API do GLM-5.2 custa US$ 1,40 por 1 milhão de tokens de entrada e US$ 4,40 por 1 milhão de tokens de saída.
Warren Spector, cofundador da OtherSide Entertainment e creditado pela criação de Deus Ex e System…
As ações da ASML dispararam para a máxima de 52 semanas após a Intel anunciar…
O artista 3D australiano Leo Torres criou uma renderização em escala realista da cidade cogumelo…
A Midjourney, amplamente conhecida como desenvolvedora de um gerador de imagens com inteligência artificial, aventurou-se…
Os especialistas da Counterpoint Research consideram a queda nas vendas de smartphones tão drástica que…
A Apple concordou em colaborar com a Intel no desenvolvimento e produção de processadores nos…