AVX-512 dobra AMD EPYC Bergamo, Genoa-X se beneficia do grande cache

Embora a implementação do AVX-512 em processadores AMD baseados na microarquitetura Zen 4 seja duvidosa – esses processadores não possuem registros reais de 512 bits e os registros existentes de 256 bits são usados ​​​​para isso em dois estágios, a própria situação do mercado torna esses soluções únicas.

Recurso popular A Phoronix publicou novos benchmarks que examinam os benefícios de habilitar o suporte AVX-512 em sistemas baseados em AMD Bergamo. A questão do impacto no desempenho do grande V-Cache 3D no novo EPYC Genoa-X também é cuidadosamente considerada.

O suporte AVX-512 pode ser muito útil para um processador AMD EPYC. Fonte aqui e abaixo: Phoronix

Apesar de o AVX-512 ser uma criação da Intel, a situação é um tanto absurda: a atual série Sapphire Rapids fica muito atrás da AMD Bergamo em termos de número de núcleos, e o multi-core (até 144 núcleos) Xeon da série Sierra Forest, provavelmente, o suporte AVX-512 / AVX10 não receberá.

Assim, AMD Bergamo com núcleos Zen 4c são os únicos processadores de 128 núcleos do mundo com suporte para extensões de 512 bits. O exemplo do AMD EPYC 9754 mostra que, apesar da falta de registros completos dessa largura, o benefício da ativação do AVX-512 pode ser bastante significativo, em alguns casos quase o dobro e no TensorFlow até seis ou dez vezes.

O resultado resumido mostra que a ativação do AVX-512 dá ao Bergamo um aumento duplo no desempenho, embora, é claro, no final tudo dependa da carga de trabalho específica. Curiosamente, o uso de extensões de 512 bits praticamente não afeta as características de frequência do processador – em média, esse número permaneceu igual aos mesmos 2,9 GHz sem o AVX-512.

Mas o consumo de energia e a dissipação de calor neste modo aumentam visivelmente, mas não tanto a ponto de causar problemas de superaquecimento ou ativação do modo de aceleração, como em alguns dos primeiros modelos Intel Xeon com suporte AVX-512.

E agora vamos passar para o EPYC 9684X (Genoa-X) – também um processador bastante exclusivo que combina 96 núcleos, AVX-512 e 3D V-Cache, elevando o cache L3 total para gigantescos 1,1 GB. Neste caso, a diferença também varia muito em função da natureza da carga, mas em alguns casos pode ser dupla.

Em média, o efeito se expressa em um aumento de produtividade de 12%, o que também é bastante bom. Desativar o 3D V-Cache não afeta a velocidade do clock e o consumo de energia. Assim, torna-se óbvio que o AMD EPYC 9684X é um processador específico, inferior no número de núcleos Bergamo e adaptado exclusivamente para cargas que podem efetivamente usar uma grande quantidade de cache, como OpenFOAM ou OpenVINO.

avalanche

Postagens recentes

A Funcom está atualizando Conan Exiles para a Unreal Engine 5 gratuitamente – Trailer e detalhes de Conan Exiles Enhanced

A editora e desenvolvedora norueguesa Funcom, em colaboração com o estúdio canadense Inflexion Games (Nightingale),…

46 minutos atrás

A União Europeia está forçando o Google a abrir o Android para concorrentes do Gemini.

O Google está enfrentando crescente pressão da União Europeia para permitir que assistentes de IA…

2 horas atrás

Elon Musk terá que devolver US$ 29 bilhões à Tesla para receber seu bônus de longa data de US$ 56 bilhões.

Em 21 de abril, o conselho de administração da Tesla revogou por unanimidade uma bonificação…

3 horas atrás

A Honor apresentou o poderoso notebook gamer Win H9 com seis ventoinhas para operação silenciosa.

A Honor apresentou o notebook gamer Win H9. O sistema vem equipado com seis ventoinhas…

3 horas atrás

A Marvell adquire a Polariton, desenvolvedora de soluções plasmônicas.

A Marvell Technology anunciou a aquisição da Polariton Technologies, desenvolvedora de dispositivos fotônicos de alta…

4 horas atrás

Tim Cook revelou seu primeiro grande erro como CEO da Apple.

O CEO da Apple, Tim Cook, classificou o lançamento fracassado do Apple Maps em 2012…

4 horas atrás