A Intel mostrou os resultados dos testes do acelerador Max 1550 e falou sobre os futuros chips Gaudi3 e Falcon Shores

No SC23, a Intel mostrou vários slides interessantes. Eles contêm resultados de testes do acelerador Max 1550 com arquitetura Xe, bem como planos para a próxima geração de aceleradores Gaudi AI.

Imagem: Intel

Ao mesmo tempo, a empresa adotou uma abordagem diferente da habitual – em vez de demonstrar os resultados obtidos dentro das paredes da própria Intel, a palavra foi dada ao Laboratório Nacional de Argonne do Departamento de Energia dos EUA, onde neste verão foi realizada a instalação do O supercomputador da ex-classe Aurora, que atualmente ocupa o segundo lugar no TOP500, foi concluído.

Este cluster HPC utiliza módulos OAM Max 1550 (Ponte Vecchio) com pacote térmico de 600 W. Eles contêm 128 núcleos Xe e 128 GB de memória HBM2E. A interface Xe Link permite que até oito desses módulos se comuniquem diretamente, proporcionando escalabilidade mais eficiente.

Fonte das imagens aqui e abaixo: Intel via ServeTheHome

Embora o ajuste do complexo de computação Aurora ainda esteja em andamento, já existem dados sobre o desempenho do Max 1550 em comparação com o AMD Instinct MI250 e NVIDIA A100. No teste de alta física de partículas usando a combinação PyTorch + Horovod (precisão de cálculo FP32), os aceleradores Intel ficaram em primeiro lugar com confiança e também mostraram 83% de eficiência de escala em 512 nós Aurora.

Num teste que simula o comportamento de um complexo de nanopartículas de silício, os aceleradores Max 1550 também saíram em primeiro lugar, tanto em termos absolutos como no teste de 128 nós, em comparação com o Polaris (quatro A100 por nó) e o Frontier (quatro Sistemas MI250 por nó). Escrito usando Fortran e OpenMP, o código provou funcionar ao ser dimensionado para mais de 500 nós de computação do Aurora.

Fonte da imagem: Intel via Phoronix

Em geral, os aceleradores Intel Max 1550 apresentam bons resultados e não são inferiores aos NVIDIA H100: em algumas tarefas sua eficiência relativa é de pelo menos 0,82, mas na maioria dos outros testes esse valor varia de 1,0 a 3,76. Obviamente, o H100 tem um rival digno, que, além disso, tem menor custo e maior disponibilidade. Mas a própria NVIDIA já apresentou chips (G)H200, e a AMD está preparando o Instinct MI300.

Os sistemas baseados em Intel Max estão disponíveis em vários formatos: tanto na Intel Developer Cloud quanto como parte de soluções OEM. A Supermicro oferece um servidor com oito módulos OAM, enquanto Dell e Lenovo oferecem soluções com quatro aceleradores no mesmo formato. A variante PCIe Max 1100 está disponível nos fabricantes acima, bem como na HPE.

Além dos aceleradores Max, a Intel também forneceu novos dados sobre o desempenho dos coprocessadores Gaudi2 AI. A empresa continua a melhorar e otimizar ativamente o ecossistema de software Gaudi. Como resultado, no sistema de inferência baseado no modelo GPT-J-6B, os resultados dos aceleradores Gaudi2 já são comparáveis ​​aos do NVIDIA H100 (SXM 80 GB), e o A100 é significativamente inferior ao Gaudi2 e ao Max 1550.

Mas o mais interessante são as informações sobre os planos para a próxima geração de Gaudí. Sabe-se agora que Gaudi3 será produzido usando um processo de 5 nm. O novo chip será quatro vezes mais rápido nos cálculos do BF16 e também terá um subsistema de memória duas vezes mais potente e 1,5 vezes mais memória HBM. Deverá ver a luz do dia em 2024.

Ao mesmo tempo, a empresa lembrou que os processadores Xeon Emerald Rapids serão apresentados exatamente em um mês, e Granite Rapids aparecerá em 2024. Em 2025 aparecerá o chip Falcon Shores, que, segundo a Intel, agora deve combinar uma GPU e um coprocessador de IA. Ele combinará as arquiteturas Habana e Xe em uma única solução com layout baseado em blocos, memória HBM3 e suporte completo a CXL.

Fonte da imagem: Intel via Phoronix

Deve-se notar que tal unificação é bastante real: a Intel está desenvolvendo ativamente uma pilha de tecnologia universal, flexível e aberta no âmbito do projeto oneAPI. Inclui todas as ferramentas necessárias – desde compiladores e bibliotecas de sistema até ferramentas de integração com mecanismos populares de análise de dados, modelos e bibliotecas de inteligência artificial.

avalanche

Postagens recentes

Os fabricantes chineses de chips encerraram o ano passado com receitas recordes.

O boom da IA ​​também está impulsionando o crescimento da receita dos fabricantes de chips…

2 horas atrás

O suporte do acelerador de IA DeepSeek V4 da Huawei impulsionou a demanda na China.

Para desenvolvedores de IA, a compatibilidade de determinadas soluções de hardware com seus softwares existentes…

3 horas atrás

O voo de teste da Starship V3 da SpaceX foi adiado novamente por um mês.

Na primeira quinzena de março, o fundador da SpaceX, Elon Musk, anunciou que o primeiro…

3 horas atrás

Revolta nas máquinas de lavar: Uma atualização de software impediu que clientes da Samsung lavassem suas roupas.

A melhoria da funcionalidade dos dispositivos por meio de atualizações de software tornou-se a norma…

5 horas atrás

Life is Strange: Reunion – O desespero leva ao sucesso. Análise / Jogos

Jogado no PlayStation 5 Quando Life is Strange: Double Exposure foi lançado, parecia que a…

10 horas atrás

O diretor criativo da Naughty Dog deixou os fãs curiosos com uma foto de sua viagem de negócios — a imagem parece ser uma prévia de Uncharted 5.

Lançados em 2016 e 2017, Uncharted 4: A Thief's End e Uncharted: The Lost Legacy…

12 horas atrás