A AMD apresentou o acelerador Instinct MI325X AI para competir com a Nvidia Blackwell e falou sobre o ainda mais poderoso Instinct MI355X

A AMD revelou oficialmente seu principal acelerador de computação, Instinct MI325X, que competirá com a Nvidia Blackwell e já entrou em produção. Ao mesmo tempo, o fabricante revelou detalhes sobre o acelerador de próxima geração – Instinct MI355X baseado na arquitetura CDNA4.

Fonte da imagem: AMD

Independentemente disso, CDNA4 é uma nova arquitetura que representa uma atualização significativa em relação ao CDNA3 anterior. A AMD o descreveu como “reimaginado do zero”, embora os especialistas digam que isso pode ser um pouco exagerado.

O acelerador MI355X será fabricado no novo processo N3 de 3 nm da TSMC, exigindo grandes mudanças em comparação com o N5, mas os principais elementos de design podem permanecer semelhantes ao CDNA3. A capacidade de memória do HBM3e chegará a 288 GB. O acelerador será equipado com 10 elementos de computação por GPU e o desempenho atingirá 2,3 petaflops de poder de computação para operações FP16 e 4,6 petaflops para FP8, o que representa um aumento de 77% em comparação com o acelerador da geração anterior.

Uma das principais inovações do MI355X será o suporte para números de ponto flutuante FP4 e FP6, que dobrará o poder de processamento do FP8, permitindo 9,2 petaflops de desempenho no FP4. Para efeito de comparação, a Nvidia Blackwell B200 oferece até 9 Pflops de desempenho FP4, e a versão mais poderosa GB200 oferece 10 Pflops. Assim, o AMD Instinct MI355X pode se tornar um sério concorrente para futuros produtos da Nvidia, inclusive graças aos 288 GB de memória HBM3E – isso é 50% a mais que a Nvidia Blackwell. Além disso, ambos os dispositivos terão largura de banda de memória de até 8 TB/s na GPU.

Como observam os especialistas, o poder computacional e a memória não são os únicos parâmetros-chave para aceleradores de IA. Um fator importante é a escalabilidade dos sistemas ao usar um grande número de GPUs. Até o momento, a AMD não revelou detalhes sobre possíveis mudanças no sistema de interconexão entre GPUs, o que pode ser um aspecto importante na comparação com a Blackwell da Nvidia.

Junto com o anúncio do Instinct MI355X, a AMD confirmou que o acelerador Instinct MI325X entrou oficialmente em produção e estará à venda neste trimestre. A principal diferença entre o MI325X e o modelo MI300X anterior foi o aumento na capacidade de memória de 192 para 256 GB. Curiosamente, foi originalmente planejado equipar o acelerador com 288 GB de memória, mas aparentemente a AMD decidiu limitar-se a um aumento de 33% em vez de 50%. A nova memória HBM3E oferece uma taxa de transferência de mais de 6 TB/s, 13% a mais que os 5,3 TB/s do MI300X.


A AMD conduziu uma análise comparativa do desempenho do Instinct MI325X e Nvidia H200. O acelerador AMD revelou-se 20-40% mais rápido que seu concorrente no lançamento de grandes modelos de linguagem já treinados e mostrou paridade de desempenho no treinamento de redes neurais.

A AMD não divulgou o custo de seus aceleradores de IA, mas funcionários da empresa disseram que um dos objetivos é fornecer uma vantagem no custo total de propriedade (TCO). Isto pode ser conseguido através de um melhor desempenho com o mesmo preço, ou através de um preço mais baixo com o mesmo desempenho. Como observou um porta-voz da AMD: “Somos empresários e tomaremos decisões de preços responsáveis”. O Instinct MI355X está programado para ser lançado no segundo semestre de 2025.

avalanche

Postagens recentes

A montadora chinesa GAC ​​apresenta o robô humanóide GoMate com 38 graus de liberdade

A gigante automobilística chinesa GAC ​​apresentou em um evento em Xangai um robô humanóide com…

2 horas atrás

O principal concorrente da Tesla lançou o desenvolvimento de robôs humanóides

A chinesa BYD, uma das maiores fabricantes mundiais de veículos elétricos, montou um laboratório especial…

2 horas atrás

Omdia: O rápido crescimento na demanda de TPU do Google desafia o domínio da NVIDIA no mercado de aceleradores de IA

A pesquisa mais recente da Omdia mostra que o rápido crescimento na demanda por aceleradores…

3 horas atrás

“Para o inferno com o Embracer Group”: um desconhecido vazou o código-fonte de Saints Row IV

Após o vazamento do código-fonte do Grand Theft Auto V no último Natal de 2024,…

3 horas atrás

Ubitium criou um processador universal – ele sozinho executa o trabalho de CPU, GPU, FPGA e DSP

Por mais de 50 anos, a indústria de semicondutores baseou-se no algoritmo de hardware Tomasulo,…

3 horas atrás