Categorias: Mercado de tecnologia e TI. notícia

O Huawei CloudMatrix 384 Super Accelerator é mais rápido que o NVIDIA GB200 NVL72, mas consome muito mais energia

A Huawei anunciou seu próprio superacelerador CloudMatrix 384 na Huawei Cloud Ecosystem Conference 2025, que se posiciona como uma alternativa doméstica ao sistema NVIDIA GB200 NVL72. A solução da Huawei tem desempenho geral maior: 300 Pflops versus 180 Pflops. Mas, ao mesmo tempo, é inferior à solução da NVIDIA em termos de desempenho por chip e tem consumo de energia significativamente maior, escreve a SemiAnalysis.

O Huawei CloudMatrix 384 usa 384 aceleradores Huawei Ascend 910C, enquanto o GB200 NVL72 usa 36 processadores Grace combinados com 72 aceleradores B200 (Blackwell). Ou seja, para dobrar o desempenho do GB200 NVL72, foram necessários cerca de cinco vezes mais aceleradores Ascend 910C, o que não é muito bom em termos de uso dos próprios aceleradores, mas excelente no nível de implantação do sistema, observou o recurso SemiAnalysis. De acordo com a SemiAnalysis, a Huawei está uma geração atrás da NVIDIA em desempenho de chips, mas à frente no design e na implantação de sistemas escaláveis.

Fonte da imagem: TechPowerUp

Ao comparar aceleradores individuais, o NVIDIA GB200 supera claramente o Huawei Ascend 910C, oferecendo mais de três vezes o desempenho em computação BF16 (2500 vs. 780 TFlops) e maior HBM on-chip (192 vs. 128 GB) com maior largura de banda de memória (8 vs. 3,2 TB/s). Em outras palavras, a NVIDIA tem uma vantagem em potência bruta e no nível do chip.

Mas no nível do sistema, a eficiência do CloudMatrix CM384 é a melhor. Ele oferece 1,7x mais petaflops, tem 3,6x mais HBM, fornece 2,1x mais largura de banda de memória e integra mais de cinco vezes mais aceleradores que o GB200 NVL72. No entanto, essa escalabilidade tem um custo, já que o sistema da Huawei consome quase quatro vezes mais energia — 145 kW contra ~560 kW. O Huawei CloudMatrix 384 requer 3,9 vezes mais energia que o GB200 NVL72: 2,3 vezes mais energia por FLOP, 1,8 vezes mais energia por TB/s de largura de banda de memória e 1,1 vezes mais energia por TB de HBM.

O SCMP, citando dados da própria Huawei, relata que o CloudMatrix CM384 demonstrou desempenho no nível de 800 Pflops em cálculos BF16 sem escassez, ou 1920 tokens/s no modelo DeepSeek-R1. O superacelerador é alojado em 16 racks, quatro dos quais são reservados apenas para interconexão – um total de 6912 portas 400G. Os racks restantes contêm 32 aceleradores Ascend 910C em quatro nós (8×4) e um switch ToR.

Como observou a SemiAnalysis, seria enganoso dizer que o Ascend 910C e o CloudMatrix 384 são feitos na China: o HBM neles é da Samsung, os wafers são da TSMC e o hardware em si é dos EUA, Holanda e Japão. Embora a SMIC da China já tenha um processo de 7 nm, a grande maioria dos Ascend 910B/910C foi secretamente fabricada no processo de 7 nm da TSMC. Acredita-se que a Huawei tenha contornado as sanções dos EUA ao encomendar US$ 500 milhões em chips por meio da Sophgo. A própria TSMC parou de fornecer para a Huawei em 2020.

avalanche

Próximo Pasta vazia misteriosa aparece no Windows 10 e 11 — Microsoft explica por que ela está lá »

Anterior « Microsoft lança controles e case para Xbox Series X com tema de Doom: The Dark Ages

Deixar comentário

Publicado por

avalanche

12 meses atrás

Postagens recentes

Inteligência artificial em áreas rurais: NetApp e NTT testam treinamento LLM geodistribuído

Segundo o Blocks & Files, o consórcio internacional IOWN (Innovative Optical and Wireless Network Global…

12 minutos atrás

Sistemas operacionais

A Microsoft obrigará os PCs que executam versões mais antigas do sistema operacional a atualizarem para o Windows 11 25H2.

A Microsoft forçará a atualização de computadores com Windows 11 24H2 para a versão mais…

33 minutos atrás

Arquivadores

A Nvidia demonstra a compressão de textura neural: o consumo de memória de vídeo cai quase 7 vezes.

Na GTC 2026, a Nvidia não apenas apresentou sua tecnologia de upscaling baseada em IA,…

2 horas atrás

Inteligência Artificial, Aprendizado de Máquina, Redes Neurais

A gestão da OpenAI passou por mais uma rodada de mudanças de pessoal, algumas das quais foram forçadas.

A OpenAI realizou diversas mudanças em seu quadro de funcionários, segundo reportagem da Bloomberg, que…

2 horas atrás

Periféricos de áudio / vídeo, fones de ouvido, webcams

Especialistas do iFixit desmontaram os fones de ouvido Apple AirPods Max 2, revelando que o layout interno permanece inalterado.

O fato de a Apple não ter alterado nada no design dos novos fones de…

2 horas atrás

Espaço

A espaçonave Orion, da missão Artemis II, já percorreu mais da metade de sua jornada até a Lua.

No terceiro dia de voo da espaçonave Orion da missão Artemis II, a tripulação já…

2 horas atrás

O Huawei CloudMatrix 384 Super Accelerator é mais rápido que o NVIDIA GB200 NVL72, mas consome muito mais energia

Conteúdo relacionado

Postagens recentes

Inteligência artificial em áreas rurais: NetApp e NTT testam treinamento LLM geodistribuído

A Microsoft obrigará os PCs que executam versões mais antigas do sistema operacional a atualizarem para o Windows 11 25H2.

A Nvidia demonstra a compressão de textura neural: o consumo de memória de vídeo cai quase 7 vezes.

A gestão da OpenAI passou por mais uma rodada de mudanças de pessoal, algumas das quais foram forçadas.

Especialistas do iFixit desmontaram os fones de ouvido Apple AirPods Max 2, revelando que o layout interno permanece inalterado.

A espaçonave Orion, da missão Artemis II, já percorreu mais da metade de sua jornada até a Lua.