AVX-512 dobra AMD EPYC Bergamo, Genoa-X se beneficia do grande cache

Embora a implementação do AVX-512 em processadores AMD baseados na microarquitetura Zen 4 seja duvidosa – esses processadores não possuem registros reais de 512 bits e os registros existentes de 256 bits são usados ​​​​para isso em dois estágios, a própria situação do mercado torna esses soluções únicas.

Recurso popular A Phoronix publicou novos benchmarks que examinam os benefícios de habilitar o suporte AVX-512 em sistemas baseados em AMD Bergamo. A questão do impacto no desempenho do grande V-Cache 3D no novo EPYC Genoa-X também é cuidadosamente considerada.

O suporte AVX-512 pode ser muito útil para um processador AMD EPYC. Fonte aqui e abaixo: Phoronix

Apesar de o AVX-512 ser uma criação da Intel, a situação é um tanto absurda: a atual série Sapphire Rapids fica muito atrás da AMD Bergamo em termos de número de núcleos, e o multi-core (até 144 núcleos) Xeon da série Sierra Forest, provavelmente, o suporte AVX-512 / AVX10 não receberá.

Assim, AMD Bergamo com núcleos Zen 4c são os únicos processadores de 128 núcleos do mundo com suporte para extensões de 512 bits. O exemplo do AMD EPYC 9754 mostra que, apesar da falta de registros completos dessa largura, o benefício da ativação do AVX-512 pode ser bastante significativo, em alguns casos quase o dobro e no TensorFlow até seis ou dez vezes.

O resultado resumido mostra que a ativação do AVX-512 dá ao Bergamo um aumento duplo no desempenho, embora, é claro, no final tudo dependa da carga de trabalho específica. Curiosamente, o uso de extensões de 512 bits praticamente não afeta as características de frequência do processador – em média, esse número permaneceu igual aos mesmos 2,9 GHz sem o AVX-512.

Mas o consumo de energia e a dissipação de calor neste modo aumentam visivelmente, mas não tanto a ponto de causar problemas de superaquecimento ou ativação do modo de aceleração, como em alguns dos primeiros modelos Intel Xeon com suporte AVX-512.

E agora vamos passar para o EPYC 9684X (Genoa-X) – também um processador bastante exclusivo que combina 96 núcleos, AVX-512 e 3D V-Cache, elevando o cache L3 total para gigantescos 1,1 GB. Neste caso, a diferença também varia muito em função da natureza da carga, mas em alguns casos pode ser dupla.

Em média, o efeito se expressa em um aumento de produtividade de 12%, o que também é bastante bom. Desativar o 3D V-Cache não afeta a velocidade do clock e o consumo de energia. Assim, torna-se óbvio que o AMD EPYC 9684X é um processador específico, inferior no número de núcleos Bergamo e adaptado exclusivamente para cargas que podem efetivamente usar uma grande quantidade de cache, como OpenFOAM ou OpenVINO.

avalanche

Postagens recentes

Hideki Sato, o pai dos consoles de jogos da Sega, faleceu.

Pouco antes do último fim de semana, Hideki Sato, um pioneiro dos consoles de jogos…

2 horas atrás

PlayStation 6 pode ter que esperar até 2028-2029 – Sony considera adiamento devido à crise de memória

Segundo uma reportagem recente da Bloomberg, a Sony está considerando adiar o lançamento do seu…

4 horas atrás

As GPUs Xe Next de próxima geração da Intel serão otimizadas para IA, não para jogos.

Como parte de sua estratégia de desenvolvimento atualizada, a Intel confirmou seus planos de lançar…

5 horas atrás

Os desenvolvedores veteranos de Diablo lançaram uma demo em grande escala do RPG de ação de próxima geração, Darkhaven, no Steam.

Uma demo de Darkhaven, um RPG de ação e fantasia sombria de nova geração da…

6 horas atrás

Milhares de usuários reclamaram de problemas com a rede social X.

Inúmeros usuários relataram que a rede social X estava indisponível. Os relatos de problemas começaram…

6 horas atrás