As sanções não ajudaram: o modelo de IA da Z.ai, da China, treinado com chips da Huawei, alcançou as primeiras posições nos rankings.

A empresa chinesa Z.ai lançou o modelo de IA GLM-5.2, que imediatamente conquistou o primeiro lugar no Índice de Análise Artificial. Toda a família de modelos GLM-5 foi treinada exclusivamente em processadores Huawei Ascend 910B, com o hardware da NVIDIA estritamente evitado. Enquanto os EUA tentam restringir o acesso aos modelos de circuito fechado mais poderosos, como o Fable 5 e o Mythos 5, a China disponibiliza o modelo como código aberto, que pode ser baixado e executado localmente.

Fonte da imagem: unsplash.com

Em 17 de junho, a Z.ai publicou os resultados oficiais do benchmark GLM-5.2, juntamente com os pesos licenciados sob a licença MIT para o Hugging Face. Esses resultados colocam o GLM-5.2 em uma posição verdadeiramente competitiva em comparação com modelos ocidentais fechados. No ranking do Code Arena, baseado em votação humana aos pares, o GLM-5.2 conquistou o segundo lugar geral com uma pontuação de 1595 e o primeiro lugar entre os modelos disponíveis, já que o Fable 5 foi removido da amostra do Arena após a proibição de exportação.

No SWE-bench Pro, um benchmark do mundo real para resolução de problemas do GitHub, o GLM-5.2 obteve 62,1 pontos, superando o GPT-5.5 da OpenAI, que alcançou 58,6 pontos. No Design Arena, o GLM-5.2 conquistou o primeiro lugar geral. No entanto, no SWE-Marathon, o benchmark mais exigente para avaliar a codificação baseada em agentes com um horizonte de longo prazo, o GLM-5.2 obteve apenas 13,0 pontos, em comparação com 26,0 para o Claude Opus 4.8.

Fonte da imagem: Z.ai

De acordo com o Índice de IA de 2026 da Universidade de Stanford, a diferença geral de desempenho entre os melhores modelos de IA americanos e chineses diminuiu para 2,7 pontos percentuais, mas a vantagem dos modelos americanos permanece nas tarefas de raciocínio lógico mais desafiadoras, projetadas especificamente para evitar manipulação.

O GLM-5.2 utiliza uma arquitetura de Mistura de Especialistas (MoE) com 744 bilhões de parâmetros, dos quais aproximadamente 40 bilhões são usados ​​para cada inferência. O mecanismo de roteamento seleciona oito das 256 sub-redes de especialistas para cada token, deixando as demais inativas, permitindo que o modelo mantenha recursos de última geração sem incorrer no custo computacional total de cada consulta.

O recurso arquitetônico mais significativo para uso em contextos de longo prazo é a integração de um mecanismo de Atenção Esparsa DeepSeek (DSA). Em vez de calcular a atenção quadrática completa para todos os tokens em uma janela de contexto, o que se torna proibitivamente caro para um milhão de tokens, o DSA direciona a atenção seletivamente para os tokens mais relevantes. Isso torna viável, em vez de teórico, o uso de uma janela de contexto de 1 milhão de tokens, e é o DSA que permite ao GLM-5.2 processar toda uma grande base de código em uma única passagem de inferência.

Fonte da imagem: Z.ai

As vantagens e desvantagens da plataforma de treinamento Ascend da Huawei são evidentes. O GLM-5.2 gera aproximadamente 17 a 19 tokens por segundo durante a inferência, em comparação com 25 a 30 tokens por segundo ou mais para concorrentes baseados em chips da Nvidia. Essa diferença na taxa de transferência reflete tanto a sobrecarga do roteamento MoE quanto a menor taxa de transferência do hardware Ascend em comparação com os processadores da classe H100 da Nvidia.

O treinamento do modelo GLM-5.2 exigiu aproximadamente 15% mais tempo computacional do que execuções semelhantes em chips da Nvidia. Especialistas estimam que o treinamento custou aproximadamente US$ 25 milhões, um valor significativamente menor do que o custo de treinamentos semelhantes de modelos de ponta nos EUA. Isso foi possível graças ao custo relativamente baixo dos chips Ascend e aos subsídios do governo chinês.

Fonte da imagem: Huawei

A proximidade com os benchmarks e a utilidade no mundo real não são a mesma coisa. Nos testes mais desafiadores do ARC-AGI-2, que avaliam o raciocínio flexível em vez de padrões aprendidos, os modelos chineses avançados apresentam desempenho significativamente inferior aos americanos. Especialistas da Epoch AI estimam que a diferença seja de, em média, sete meses em todo o índice de capacidades avançadas. No entanto, o modelo GLM-5.2 reduziu o tempo para atingir a paridade com os benchmarks mais rapidamente do que o esperado por observadores externos.

O argumento a favor do controle de exportação de modelos americanos avançados baseia-se, em parte, na suposição de que os laboratórios chineses estão significativamente atrasados ​​no domínio de tecnologias avançadas. Contudo, se o modelo chinês demonstrar conformidade com as principais capacidades comerciais da Fable até o final de 2026, dúvidas legítimas sobre a adequação das restrições impostas pelo governo dos EUA surgirão.

Os pesos do modelo GLM 5.2 publicados no Hugging Face são verdadeiramente gratuitos: licenciados sob a licença MIT, de uso ilimitado, sem bloqueio regional e sem possibilidade de revogação de acesso por qualquer governo após o upload. Um desenvolvedor que hospeda o GLM-5.2 por conta própria fica protegido tanto de ordens de exportação dos EUA quanto do acesso aos dados pelo governo chinês. Hospedar os pesos por conta própria elimina o vazamento de dados via API, mas requer aproximadamente 1,5 TB de memória de GPU, o que é proibitivo para equipes sem infraestrutura de escala empresarial.

Fonte da imagem: Z.ai

Mas uma API em nuvem é uma questão completamente diferente. A Z.ai é uma empresa sediada em Pequim, registrada e operando sob a lei chinesa. A Lei Nacional de Inteligência da China exige que todas as organizações e cidadãos chineses “apoiem, auxiliem e cooperem com as atividades de inteligência do Estado”. A Lei de Segurança de Dados e a Lei de Segurança Cibernética adicionam disposições adicionais referentes à localização de dados e ao acesso governamental. Essas são condições legais fixas que se aplicam independentemente da política de privacidade declarada da Z.ai ou da localização física de seus servidores.

Em janeiro de 2025, o Departamento de Segurança Industrial dos EUA adicionou a Z.ai à sua lista de sanções, citando o papel da empresa no avanço da modernização das forças armadas chinesas por meio do desenvolvimento de IA. Em maio de 2026, parlamentares da Câmara dos Representantes dos EUA iniciaram uma investigação formal sobre os riscos de segurança cibernética representados pelos modelos de IA chineses em infraestruturas críticas, incluindo a Z.ai entre as empresas sob rigorosa vigilância.

Desde outubro de 2022, o governo dos EUA vem sistematicamente apertando os controles sobre as exportações de chips de IA, buscando limitar o acesso da China a tecnologias avançadas e desacelerar o desenvolvimento da IA ​​chinesa. A família de modelos GLM-5, treinada em 100.000 chips Huawei Ascend 910B sem o envolvimento da Nvidia, sugere o efeito exatamente oposto ao dessas medidas.

admin

Compartilhar
Publicado por
admin

Postagens recentes

O Steam Machine receberá suporte para FSR 4 “em breve”.

A Valve está trabalhando com a AMD para adaptar a tecnologia FSR 4 ao sistema…

7 horas atrás

O Valve permitirá que você transforme qualquer PC similar em uma Steam Machine.

Os interessados ​​podem construir sua própria "Steam Machine" caso não tenham a sorte de encomendar…

8 horas atrás

A AMD lançou um driver com suporte para o escalonamento FSR 4.1 nas placas gráficas Radeon RX 7000.

A AMD lançou a versão mais recente do driver gráfico Radeon Software Adrenalin 26.6.2 WHQL.…

10 horas atrás