No Hot Chips 34, a AMD compartilhou detalhes sobre os aceleradores de servidor da série Instinct MI200 baseados nas GPUs Aldebaran CDNA 2. Essas são as primeiras soluções gráficas da AMD a usar uma pilha de vários chips, também conhecida como layout MCM.

Fonte da imagem: AMD

Algumas das principais características do Instinct MI200 são:

  • Arquitetura CDNA 2 com núcleos de matriz de segunda geração para acelerar os cálculos FP64 e FP32. Eles fornecem até quatro vezes o desempenho das operações FP64 em comparação com a geração anterior de aceleradores de servidor AMD;
  • Tecnologia de empacotamento avançada 2.5D Elevated Fanout Bridge (EFB) que oferece até 1,8x mais núcleos e até 2,7x mais largura de banda de memória do que a geração anterior de GPUs de servidor AMD, ao mesmo tempo em que atinge o pico de largura de banda de memória de 3x, 2 TB/s;
  • Terceira geração do barramento AMD Infinity Fabric; suporte para até 8 pistas Infinity Fabric, que fornecem comunicação entre vários AMD Instinct MI200s, bem como processadores AMD EPYC, incluindo a terceira geração, que fornece ao sistema memória unificada de CPU/GPU e aumenta a taxa de transferência máxima.

Como parte dos aceleradores AMD Instinct MI200, é usado um processador gráfico com dois cristais (chiplets) – o principal e o secundário. Cada chip contém 8 mecanismos de sombreamento, cada um contendo 14 unidades de computação (CUs) para operações de FP64, FP32, bem como mecanismos de matriz de segunda geração para operações de FP16 e BF16.

Assim, existem 112 unidades de computação ou 7.168 processadores de fluxo por matriz e 224 CUs ou 14.336 processadores de fluxo para toda a GPU. A GPU é fabricada usando o processo de 6nm da TSMC. No total, existem 58 bilhões de transistores na GPU.

Diagrama de blocos da GPU AMD Instinct MI200

A GPU Aldebaran usa o barramento xGMI de alta velocidade. Cada chiplet possui um mecanismo VCN 2.6 e um controlador de E/S principal, quatro controladores de memória HBM2e de 1024 bits cada. Cada chiplet também possui 8 MB de cache L2, divididos fisicamente em 32 blocos, e 64 GB de memória HBM2e com throughput de 1,6 TB/s. A quantidade total de memória HBM2e na GPU pode ser de até 128 GB e sua largura de banda é de 3,2 TB / s. Isso é 1,2 TB/s mais alto que o NVIDIA A100 equipado com 80 GB de memória HBM2e.

AMD Aldebaran suporta 8 canais Infinity Fabric. Um deles pode ser usado para conectar a CPU e a GPU (via PCI Express). Ele foi projetado para uma taxa de transferência de dados consistente de 144 GB / s. Escale até 500 GB/s usando um link externo Infinity Fabric com quatro aceleradores AMD Instinct MI200 conectados ou usando um PCIe 4.0 ESM AIC para taxa de transferência de 100 GB/s.

Métrica de desempenho do AMD Instinct MI200

A AMD afirma que, dependendo da tarefa, o Aldebaran pode ser até três vezes mais rápido que o NVIDIA A100.

Os aceleradores AMD Instinct MI200 baseados na arquitetura CNDA 2 já são usados ​​como parte do supercomputador Frontier exascale, que supera a classificação TOP500 dos supercomputadores mais poderosos do mundo. Ele oferece 1,1 exaflops de desempenho.


A AMD também anunciou planos para lançar uma nova geração de aceleradores de computação Instinct MI300. Eles também usarão um layout de chiplet, mas já serão APUs – os cristais de CPU e GPU serão combinados no mesmo substrato. O Instinct MI300 afirma usar as arquiteturas de GPU CDNA 3 e Zen 4 e desempenho de IA até 5x mais rápido do que a arquitetura CDNA 2.

avalanche

Postagens recentes

Darwin’s Paradox! — um jogo de plataforma com alma e tentáculos. Análise

Processador Intel ou AMD quad-core rodando a 2,5 GHz, 8 GB de RAM, placa de…

4 horas atrás

“Parece muito melhor do que antes”: Três minutos de “jogabilidade pura” de Heroes of Might & Magic: Olden Era deixam os fãs animados antes do Acesso Antecipado.

Antes do lançamento iminente do Acesso Antecipado, os desenvolvedores do estúdio cipriota com raízes russas,…

6 horas atrás

O teaser do novo companheiro na expansão Untold Museon decepcionou os fãs de Warhammer 40.000: Rogue Trader.

A Owlcat Games, um estúdio cipriota com raízes russas, lançou um novo teaser para The…

8 horas atrás

O maior parque eólico dos EUA foi inaugurado discretamente, com a operadora temendo a reação de Trump.

O portal americano Grid Status inadvertidamente divulgou informações sobre o início das operações do maior…

8 horas atrás

A Anthropic lançou o Claude Design, uma IA de design para quem não entende nada de design.

A Anthropic anunciou o lançamento do Claude Design, uma nova ferramenta experimental de design visual…

8 horas atrás

Startups europeias prometem superar os chips de IA da Nvidia em 100 vezes, mas lhes faltam fundos e fábricas.

Startups europeias que desenvolvem alternativas às GPUs da Nvidia buscam escalar seus negócios em meio…

8 horas atrás