ogm1nje4odrlmzk4ymexowy4m2myntdjytaxyjc1mdy0nzqymjbhnwflywe3mdfkzthknzzingzjy2jhmzg3nw-6483728

O AMD Instinct MI100 é o primeiro acelerador baseado na arquitetura CDNA 7nm, que, ao contrário do RDNA, é focado em computação, não em gráficos, embora retenha alguns componentes para renderização. No entanto, RDNA e CDNA se separaram completamente, e o novo acelerador é destinado exclusivamente para computação de alto desempenho e IA.

O primogênito da série MI100 tem 120 CUs, que contêm novos blocos para operações de matriz que são importantes em cargas de trabalho de IA. Mas eles não funcionam em detrimento dos cálculos “clássicos” – o desempenho de pico do FP64 é 11,5 teraflops, e para o FP32 é exatamente o dobro, 23 teraflops. Esses números são maiores do que os do NVIDIA A100, e a AMD insiste que este é exatamente o aumento de desempenho necessário para alcançar o cobiçado desempenho de um exaflops planejado.

AMD Instinct MI100

yzjlymm4yti5yty3ztg5oti3nzu4njg1y2exndq2zde3yzeznzhjzjgymtczyzriztgyzjk5zjiymgnlnza3nqsm-adv_-800-2786380njrintrjzdbmyji1mzuxmjfhm2m5yzvlmgmyzmvhmjfioduzyty4yzc2nzjhytk1ogywmtq2mda0mjkznduwyqsm-arc_-800-2040111

No entanto, na outra extremidade do espectro, nos cálculos do bfloat16, o novo produto da AMD perde – 92,3 teraflops contra 312 teraflops no Tensor Core. Outros valores de desempenho relatados para outras taxas de precisão computacional variam. Além disso, a versão PCIe do A100 pode ser um pouco mais lenta do que a versão SXM devido ao seu menor consumo de energia em tarefas reais. E o Instinct MI100, de qualquer maneira, está disponível apenas no formato de uma placa PCIe de tamanho completo com um consumo de 300 W.

njjjyty1otnimzm3zjzhmdy0zjzjmgm2mjexowy5mgu1ythlogqzzdjkowy5n2mxzwq3zte4mddiyme3ndrhywsm-dawn_-800-1161553zjvhotk3odg0yjnjmgvknzbimddlzti1owniogi1zwnjmzhjzme2ytnkztg5ztixymi4nme4ytgxy2mynjk2zasm-curve_-800-2843927

A placa é equipada com 32 GB de memória HBM2 com largura de banda de 1,23 TB / s, que é um pouco menor que a versão PCIe da NVIDIA A100: 40 GB HBM2e e 1,555 TB / s, respectivamente. Ambas as placas possuem uma interface PCIe 4.0 x16 principal (64 GB / s) e um barramento adicional para troca direta de dados entre aceleradores. No caso da NVIDIA, é o NVLink (600 GB / s), que para a versão PCIe é limitado a apenas duas placas, e no caso da AMD é o Infinity Fabric (IF).

O MI100 possui três interfaces IF com largura de banda de 92 GB / s (276 GB / s no total), o que possibilita combinar até quatro aceleradores que podem se comunicar um com o outro de maneira um a um. Além disso, não depende de qual interface, PCIe 3.0 ou 4.0, os próprios aceleradores estão conectados ao host. Naturalmente, a melhor opção para o sistema como um todo será uma combinação do AMD EPYC e do novo MI100.

nzjiztjkmdk2yjbimzewodfkyzkzyza5zty2zthhndi3mtmyntnjy2nhnjvkmdixzjyymde3njdlmmq2ymuzzqsm-mi100-800-7290505mzzlyjg4mzq2mzq2mtcznwu0mze4mzbkmzi3y2y1mzg1ztk4njiyotfkyjqxzju3yja2m2u0m2q3ywqxzwu2ngsm-perf_-800-8705245

O principal trunfo da AMD, como já aconteceu antes, é o custo dos novos produtos. A empresa não dá preços exatos, mas diz que em termos de desempenho por dólar, eles são 1,8-2,1 vezes melhores do que o NVIDIA A100. Entre os primeiros sistemas para os quais os novos aceleradores foram validados estão Dell PowerEdge R7525, Gigabyte G482-Z54, HPE Apollo 6500 Gen10 Plus, Supermicro AS-4124GS-TNR. Parceiros selecionados já receberam novos aceleradores e sistemas baseados neles para avaliação de desempenho e adaptação de software.

ndm1zwq3nwq1ogmzowrmmjhmoge4nja2odjhyte2mdc4ota5zmy2yje1nwfiowflywy1ngzhzjnjyjc2nmnkngsm-rocm_-800-9780117y2jhnwi5zjy3mwezmthkmjjlnzy2ytiwyzzkywexmtawyty1njyzotexyjfiyzy2nmezmwy3mdvhzgjlzjq4yqsm-revo_-800-1716238

Junto com o lançamento do Instinct MI100, a AMD também anunciou um novo lançamento importante do ROCm 4.0, uma plataforma de software aberta para HPC e IA. A AMD destaca o desempenho aprimorado, a facilidade de uso e a prontidão de muitas soluções de software para trabalhar com a nova versão e o novo hardware. E o mais importante, a facilidade de portar o código para uma nova plataforma, principalmente com NVIDIA CUDA. Para alguns desenvolvedores, levou literalmente de várias horas a um dia ou até várias semanas em casos mais complexos.

mwqxzte0ogy5mtjhmzljztgwnwzmyzk4ywu5ymzkmju5yjy1mtaznzi1mdm4mzdmzjg0odg1zdm1yjk5ntzhnasm-port_-800-9568773

Uma nova plataforma de hardware e software baseada em AMD EPYC, Instinct M100 e ROCm 4.0 formará a base dos próximos supercomputadores Frontier e Pawsey. Mas se os carros novos com MI100 estarão na nova classificação TOP500, descobriremos amanhã. Os novos produtos vão competir com os novos aceleradores NVIDIA A100 com o dobro da memória HBM2e.

zdm3n2y4mwi5ota1yzrimzkyotiyyjq2zgexnwrlmtlmztg3owewmwmwndzlowm4oti3ytdkmmm5ogzmytmwygsm-asci_-800-2520968

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *