O desempenho estimado e os detalhes do Radeon Instinct MI100 de última geração, com base na arquitetura CDNA da próxima geração, foram publicados pela AdoredTV, juntamente com os slides da AMD. Este post relata o desempenho deste acelerador HPC versus NVIDIA Volta e Ampere.
A AdoredTV afirma que recebeu slides da apresentação oficial do AMD Radeon Instinct MI100. Eles foram refeitos para evitar acusações, mas todos os dados foram mantidos intactos. Primeiro, eles informam sobre o tempo de liberação das configurações do acelerador e do servidor com os parceiros.
Por exemplo, servidores com 1U Radeon Instinct MI100 com gerações AMD EPYC Roma e Milão devem ser lançados até dezembro de 2020, enquanto uma variante baseada no Intel Xeon será lançada em fevereiro de 2021. Esse servidor incluirá dois processadores AMD EPYC. Cada um deles será conectado a dois aceleradores Radeon Instinct MI100 por meio de uma interconexão Infinity Fabric de 2ª geração. Quatro aceleradores de computação da GPU poderão fornecer 136 teraflops de desempenho FP32 (SGEMM), o que significa que cada placa Radeon Instinct MI100 é capaz de fornecer 34 teraflops de potência de computação com um consumo de 300 watts.
Entre outros recursos, a largura de banda total declarada de gráficos através do PCIe é de 256 GB / s, possibilitada pelo PCIe 4.0. A largura de banda de memória combinada das quatro GPUs é de 4,9 TB / s, o que significa que a AMD está usando a DRM HBM2e (cada GPU possui largura de banda de 1,225 TB / s). O volume total é de 128 GB ou 32 GB para cada GPU.
O segundo servidor 3U deve ser lançado em março de 2021 e oferecerá especificações ainda mais impressionantes: 8 Radeon Instinct MI100s conectados a dois processadores EPYC. Os quatro aceleradores Instinct fornecerão 272 teraflops de potência de computação FP32, oferecerão 512 GB / s de largura de banda PCIe, 9,8 TB / s de largura de banda HBM e uma combinação de 256 GB de memória de vídeo. O consumo de um desses racks será de 3 kW.
Em termos de desempenho, a AMD comparou o Radeon Instinct MI100 com os aceleradores NVIDIA Volta V100 e Ampere A100. Curiosamente, os slides mencionam o acelerador de 300W Ampere A100, embora essa opção não exista: aparentemente, a AMD está falando sobre uma configuração hipotética do A100. Atualmente, existem apenas modelos de 400W (SXM) e 250W (PCIe).
De acordo com a AMD, seu acelerador Radeon Instinct MI100 oferece desempenho FP32 aproximadamente 13% mais rápido que o NVIDIA A100 (Ampere) e desempenho duas vezes mais rápido que o Tesla V100 (Volta). Em termos de desempenho por dólar, o MI100 supera o V100 em 2,4 vezes e o A100 em 1,5 vezes. Também mostra que a escala de desempenho é quase linear, mesmo com até 32 aceleradores no Resenet, o que é bastante impressionante.
É mencionado nos slides que a AMD oferecerá um desempenho muito maior em segmentos como petróleo e gás, pesquisa acadêmica e aprendizado de máquina. Outras cargas de trabalho de HPC, como computação em FP64, AI ou Data Analytics por trás do NVIDIA A100, parecem ter uma vantagem significativa.