Publicados os resultados do teste Intel Xeon Max: a memória HBM integrada oferece uma vantagem notável em cargas de trabalho de IA e HPC

Os processadores Intel da série Xeon Max diferem de suas contrapartes usuais, “não máximas”, na presença de memória HBM2e integrada com capacidade de 64 GB. O que isso lhes dá na prática? Esta questão foi investigada pelo recurso Phoronix – eles estão nas mãos dos mais recentes sistemas Supermicro Hyper SuperServer SYS-221H-TNR de dois soquetes com chips Xeon Max 9468 e 9480.

Lembre-se de que o Intel Xeon Max difere de suas contrapartes convencionais da série Sapphire Rapids pela presença de 64 GB de HBM2e a bordo, e o volume é o mesmo para todos os modelos, embora o número de núcleos possa variar de 32 a 56. Xeon Max os processadores foram testados em três modos: apenas com memória HBM (sem DDR5), com HBM como cache para 512 GB DDR5, bem como no modo “flat”, mas sem retornar o HBM a nenhum processo, ou seja, apenas com DDR5.

Imagem: Intel

Os testes mostraram que os dois primeiros modos podem realmente fornecer uma vantagem em alguns cenários de carga. Os resultados foram bastante naturais: onde uma quantidade relativamente pequena de HBM2e é suficiente, o modo HBM Only acaba sendo o mais rápido devido à alta largura de banda e à ausência da necessidade de sincronizar de alguma forma o trabalho com DDR5.

Fonte: Phoronix

No entanto, o modo cache também oferece um ganho, embora em algumas cargas de trabalho, como OpenFOAM, ele não seja tão grande. Em cenários de IA, principalmente nos benchmarks OpenVINO, a diferença é menor e, às vezes, desabilitar o HBM2e permite um desempenho um pouco melhor, especialmente em um sistema com Xeon Max 9480, onde há menos memória por núcleo. Mas em outros benchmarks, como PETSc e Stress-NG, o uso do HBM2e pode fornecer um grande aumento de desempenho que seria tolice ignorar.

Em geral, podemos afirmar com segurança que, em média, o ganho de desempenho com o cache HBM é de 10 a 11% e, se você abandonar o DDR5, poderá adicionar cerca de 8% a mais a esse valor. Também é óbvio que o consumo do sistema neste modo é visivelmente menor, já que não é necessária energia para os módulos DDR5. Em geral, podemos falar de 18-20% de superioridade em uma ampla gama de cargas, de acordo com a Phoronix.

avalanche

Postagens recentes

Com o anúncio do OCuLink Dev Kit, a Framework transforma o Laptop 16 modular em um “quase-desktop”.

A Framework, fabricante de laptops modulares, anunciou novos modelos para o Laptop 16, incluindo uma…

4 horas atrás

Linha de Defesa: Uma Visão Geral de Máquinas Virtuais e Sandboxes para Android

Aplicativos móveis com reputação duvidosa são muito comuns hoje em dia, mesmo de fontes confiáveis.…

4 horas atrás

A era dos Macs da Apple com processadores Intel está chegando ao fim – eles não receberão suporte para o próximo macOS 27.

O MacRumors lembrou que o macOS 26 Tahoe será a última versão principal do sistema…

4 horas atrás

Sai da frente, Logitech: a Framework está preparando um teclado sem fio com touchpad e arquitetura aberta.

A Framework anunciou o desenvolvimento de um novo teclado sem fio com touchpad, que substituirá…

4 horas atrás

A Turbo Cloud lançou uma plataforma para o lançamento rápido de modelos de IA com cobrança por minuto e escalonamento automático.

A provedora de nuvem Turbo Cloud (parte do cluster de TI comercial da Rostelecom) lançou…

5 horas atrás