AVX-512 dobra AMD EPYC Bergamo, Genoa-X se beneficia do grande cache

Embora a implementação do AVX-512 em processadores AMD baseados na microarquitetura Zen 4 seja duvidosa – esses processadores não possuem registros reais de 512 bits e os registros existentes de 256 bits são usados ​​​​para isso em dois estágios, a própria situação do mercado torna esses soluções únicas.

Recurso popular A Phoronix publicou novos benchmarks que examinam os benefícios de habilitar o suporte AVX-512 em sistemas baseados em AMD Bergamo. A questão do impacto no desempenho do grande V-Cache 3D no novo EPYC Genoa-X também é cuidadosamente considerada.

O suporte AVX-512 pode ser muito útil para um processador AMD EPYC. Fonte aqui e abaixo: Phoronix

Apesar de o AVX-512 ser uma criação da Intel, a situação é um tanto absurda: a atual série Sapphire Rapids fica muito atrás da AMD Bergamo em termos de número de núcleos, e o multi-core (até 144 núcleos) Xeon da série Sierra Forest, provavelmente, o suporte AVX-512 / AVX10 não receberá.

Assim, AMD Bergamo com núcleos Zen 4c são os únicos processadores de 128 núcleos do mundo com suporte para extensões de 512 bits. O exemplo do AMD EPYC 9754 mostra que, apesar da falta de registros completos dessa largura, o benefício da ativação do AVX-512 pode ser bastante significativo, em alguns casos quase o dobro e no TensorFlow até seis ou dez vezes.

O resultado resumido mostra que a ativação do AVX-512 dá ao Bergamo um aumento duplo no desempenho, embora, é claro, no final tudo dependa da carga de trabalho específica. Curiosamente, o uso de extensões de 512 bits praticamente não afeta as características de frequência do processador – em média, esse número permaneceu igual aos mesmos 2,9 GHz sem o AVX-512.

Mas o consumo de energia e a dissipação de calor neste modo aumentam visivelmente, mas não tanto a ponto de causar problemas de superaquecimento ou ativação do modo de aceleração, como em alguns dos primeiros modelos Intel Xeon com suporte AVX-512.

E agora vamos passar para o EPYC 9684X (Genoa-X) – também um processador bastante exclusivo que combina 96 núcleos, AVX-512 e 3D V-Cache, elevando o cache L3 total para gigantescos 1,1 GB. Neste caso, a diferença também varia muito em função da natureza da carga, mas em alguns casos pode ser dupla.

Em média, o efeito se expressa em um aumento de produtividade de 12%, o que também é bastante bom. Desativar o 3D V-Cache não afeta a velocidade do clock e o consumo de energia. Assim, torna-se óbvio que o AMD EPYC 9684X é um processador específico, inferior no número de núcleos Bergamo e adaptado exclusivamente para cargas que podem efetivamente usar uma grande quantidade de cache, como OpenFOAM ou OpenVINO.

avalanche

Postagens recentes

Telegram anunciou um concurso para criar um análogo do YouTube para o messenger

É bem possível que o mensageiro Telegram, que atua simultaneamente como rede social, serviço de…

2 horas atrás

Fujitsu e Supermicro desenvolverão servidores Arm e sistemas de suporte de vida para data centers

A Fujitsu e a Supermicro anunciaram uma colaboração estratégica para desenvolver servidores de próxima geração…

3 horas atrás

Para desbloquear a rede social X no Brasil, Musk pagou multa de US$ 5 milhões, mas no lugar errado

O Supremo Tribunal Federal do Brasil disse que a rede social X transferiu o dinheiro…

10 horas atrás

O Google instalará um sistema anti-roubo em todos os smartphones Android – a implantação já começou

O Google está lançando um conjunto de novos recursos, anunciados em maio, para proteger os…

10 horas atrás

A receita da Foxconn atinge o máximo histórico em meio à crescente demanda por servidores de IA

A empresa taiwanesa Foxconn superou as expectativas dos analistas ao registrar receita recorde no terceiro…

16 horas atrás