AVX-512 dobra AMD EPYC Bergamo, Genoa-X se beneficia do grande cache

Embora a implementação do AVX-512 em processadores AMD baseados na microarquitetura Zen 4 seja duvidosa – esses processadores não possuem registros reais de 512 bits e os registros existentes de 256 bits são usados ​​​​para isso em dois estágios, a própria situação do mercado torna esses soluções únicas.

Recurso popular A Phoronix publicou novos benchmarks que examinam os benefícios de habilitar o suporte AVX-512 em sistemas baseados em AMD Bergamo. A questão do impacto no desempenho do grande V-Cache 3D no novo EPYC Genoa-X também é cuidadosamente considerada.

O suporte AVX-512 pode ser muito útil para um processador AMD EPYC. Fonte aqui e abaixo: Phoronix

Apesar de o AVX-512 ser uma criação da Intel, a situação é um tanto absurda: a atual série Sapphire Rapids fica muito atrás da AMD Bergamo em termos de número de núcleos, e o multi-core (até 144 núcleos) Xeon da série Sierra Forest, provavelmente, o suporte AVX-512 / AVX10 não receberá.

Assim, AMD Bergamo com núcleos Zen 4c são os únicos processadores de 128 núcleos do mundo com suporte para extensões de 512 bits. O exemplo do AMD EPYC 9754 mostra que, apesar da falta de registros completos dessa largura, o benefício da ativação do AVX-512 pode ser bastante significativo, em alguns casos quase o dobro e no TensorFlow até seis ou dez vezes.

O resultado resumido mostra que a ativação do AVX-512 dá ao Bergamo um aumento duplo no desempenho, embora, é claro, no final tudo dependa da carga de trabalho específica. Curiosamente, o uso de extensões de 512 bits praticamente não afeta as características de frequência do processador – em média, esse número permaneceu igual aos mesmos 2,9 GHz sem o AVX-512.

Mas o consumo de energia e a dissipação de calor neste modo aumentam visivelmente, mas não tanto a ponto de causar problemas de superaquecimento ou ativação do modo de aceleração, como em alguns dos primeiros modelos Intel Xeon com suporte AVX-512.

E agora vamos passar para o EPYC 9684X (Genoa-X) – também um processador bastante exclusivo que combina 96 núcleos, AVX-512 e 3D V-Cache, elevando o cache L3 total para gigantescos 1,1 GB. Neste caso, a diferença também varia muito em função da natureza da carga, mas em alguns casos pode ser dupla.

Em média, o efeito se expressa em um aumento de produtividade de 12%, o que também é bastante bom. Desativar o 3D V-Cache não afeta a velocidade do clock e o consumo de energia. Assim, torna-se óbvio que o AMD EPYC 9684X é um processador específico, inferior no número de núcleos Bergamo e adaptado exclusivamente para cargas que podem efetivamente usar uma grande quantidade de cache, como OpenFOAM ou OpenVINO.

avalanche

Postagens recentes

O acordo da Nvidia com a Groq foi concebido para evitar problemas com as leis antitruste.

O princípio de que "tempo é dinheiro" é mais relevante do que nunca no campo…

15 minutos atrás

Outra GeForce RTX 5090 sofreu danos significativos depois que um conector de alimentação 12V-2×6 pegou fogo.

Um usuário do Reddit relatou um incêndio em um conector de alimentação 12V-2x6 de 12+4…

1 hora atrás

Há 50 anos, a inteligência artificial derrotou o campeão soviético de xadrez pela primeira vez.

Em 1975, uma aposta curiosa foi feita na URSS entre cientistas do Instituto de Ciências…

7 horas atrás

Há 50 anos, a inteligência artificial derrotou o campeão soviético de xadrez pela primeira vez.

Em 1975, uma aposta curiosa foi feita na URSS entre cientistas do Instituto de Ciências…

7 horas atrás

Médico do Ritmo – No Ritmo do Coração. Resenha

Processador Intel Core 2 Duo E4600 2.4 GHz / AMD Athlon 64 X2 4600 2.4…

7 horas atrás

A Intel montou um chip de IA gigante a partir de 16 núcleos de computação e 24 módulos HBM5.

A Intel foi a primeira a desenvolver uma arquitetura de chiplets claramente desagregada — as…

8 horas atrás