AVX-512 dobra AMD EPYC Bergamo, Genoa-X se beneficia do grande cache

Embora a implementação do AVX-512 em processadores AMD baseados na microarquitetura Zen 4 seja duvidosa – esses processadores não possuem registros reais de 512 bits e os registros existentes de 256 bits são usados ​​​​para isso em dois estágios, a própria situação do mercado torna esses soluções únicas.

Recurso popular A Phoronix publicou novos benchmarks que examinam os benefícios de habilitar o suporte AVX-512 em sistemas baseados em AMD Bergamo. A questão do impacto no desempenho do grande V-Cache 3D no novo EPYC Genoa-X também é cuidadosamente considerada.

O suporte AVX-512 pode ser muito útil para um processador AMD EPYC. Fonte aqui e abaixo: Phoronix

Apesar de o AVX-512 ser uma criação da Intel, a situação é um tanto absurda: a atual série Sapphire Rapids fica muito atrás da AMD Bergamo em termos de número de núcleos, e o multi-core (até 144 núcleos) Xeon da série Sierra Forest, provavelmente, o suporte AVX-512 / AVX10 não receberá.

Assim, AMD Bergamo com núcleos Zen 4c são os únicos processadores de 128 núcleos do mundo com suporte para extensões de 512 bits. O exemplo do AMD EPYC 9754 mostra que, apesar da falta de registros completos dessa largura, o benefício da ativação do AVX-512 pode ser bastante significativo, em alguns casos quase o dobro e no TensorFlow até seis ou dez vezes.

O resultado resumido mostra que a ativação do AVX-512 dá ao Bergamo um aumento duplo no desempenho, embora, é claro, no final tudo dependa da carga de trabalho específica. Curiosamente, o uso de extensões de 512 bits praticamente não afeta as características de frequência do processador – em média, esse número permaneceu igual aos mesmos 2,9 GHz sem o AVX-512.

Mas o consumo de energia e a dissipação de calor neste modo aumentam visivelmente, mas não tanto a ponto de causar problemas de superaquecimento ou ativação do modo de aceleração, como em alguns dos primeiros modelos Intel Xeon com suporte AVX-512.

E agora vamos passar para o EPYC 9684X (Genoa-X) – também um processador bastante exclusivo que combina 96 núcleos, AVX-512 e 3D V-Cache, elevando o cache L3 total para gigantescos 1,1 GB. Neste caso, a diferença também varia muito em função da natureza da carga, mas em alguns casos pode ser dupla.

Em média, o efeito se expressa em um aumento de produtividade de 12%, o que também é bastante bom. Desativar o 3D V-Cache não afeta a velocidade do clock e o consumo de energia. Assim, torna-se óbvio que o AMD EPYC 9684X é um processador específico, inferior no número de núcleos Bergamo e adaptado exclusivamente para cargas que podem efetivamente usar uma grande quantidade de cache, como OpenFOAM ou OpenVINO.

avalanche

Postagens recentes

A Yandex está se preparando para um lançamento em massa de robotáxis e carros autônomos até 2028.

A Yandex planeja começar a comercializar veículos robóticos em 2028, tanto no setor de táxis…

28 minutos atrás

Golpistas começaram a disfarçar malware como código-fonte vazado do Anthropic Claude Code.

Esta semana, o código-fonte do serviço Claude Code da Anthropic vazou — a empresa tomou…

41 minutos atrás

A JEDEC permitirá o crescimento da memória HBM4E para simplificar a produção e reduzir custos.

A memória empilhada, chamada HBM, é considerada uma das mais rápidas do mercado, mas continua…

41 minutos atrás

Uma startup suíça transformou baterias usadas em baterias domésticas por assinatura.

A startup suíça Evolium Technologies, fundada em 2024 com o apoio da Associação Suíça de…

53 minutos atrás

Um modelo chinês do foguete reutilizável Falcon 9 da SpaceX explodiu no ar — ele era movido a querosene produzido a partir do carvão.

Hoje, às 12h17, horário de Pequim (7h17, horário de Moscou), o foguete experimental Tianlong-3, da…

2 horas atrás

A Oracle finalmente encontrou os recursos para construir outro centro de dados de IA OpenAI Stargate.

A Related Digital, investidora em data centers, está perto de fechar um acordo de US$…

2 horas atrás