A Intel mostrou os resultados dos testes do acelerador Max 1550 e falou sobre os futuros chips Gaudi3 e Falcon Shores

No SC23, a Intel mostrou vários slides interessantes. Eles contêm resultados de testes do acelerador Max 1550 com arquitetura Xe, bem como planos para a próxima geração de aceleradores Gaudi AI.

Imagem: Intel

Ao mesmo tempo, a empresa adotou uma abordagem diferente da habitual – em vez de demonstrar os resultados obtidos dentro das paredes da própria Intel, a palavra foi dada ao Laboratório Nacional de Argonne do Departamento de Energia dos EUA, onde neste verão foi realizada a instalação do O supercomputador da ex-classe Aurora, que atualmente ocupa o segundo lugar no TOP500, foi concluído.

Este cluster HPC utiliza módulos OAM Max 1550 (Ponte Vecchio) com pacote térmico de 600 W. Eles contêm 128 núcleos Xe e 128 GB de memória HBM2E. A interface Xe Link permite que até oito desses módulos se comuniquem diretamente, proporcionando escalabilidade mais eficiente.

Fonte das imagens aqui e abaixo: Intel via ServeTheHome

Embora o ajuste do complexo de computação Aurora ainda esteja em andamento, já existem dados sobre o desempenho do Max 1550 em comparação com o AMD Instinct MI250 e NVIDIA A100. No teste de alta física de partículas usando a combinação PyTorch + Horovod (precisão de cálculo FP32), os aceleradores Intel ficaram em primeiro lugar com confiança e também mostraram 83% de eficiência de escala em 512 nós Aurora.

Num teste que simula o comportamento de um complexo de nanopartículas de silício, os aceleradores Max 1550 também saíram em primeiro lugar, tanto em termos absolutos como no teste de 128 nós, em comparação com o Polaris (quatro A100 por nó) e o Frontier (quatro Sistemas MI250 por nó). Escrito usando Fortran e OpenMP, o código provou funcionar ao ser dimensionado para mais de 500 nós de computação do Aurora.

Fonte da imagem: Intel via Phoronix

Em geral, os aceleradores Intel Max 1550 apresentam bons resultados e não são inferiores aos NVIDIA H100: em algumas tarefas sua eficiência relativa é de pelo menos 0,82, mas na maioria dos outros testes esse valor varia de 1,0 a 3,76. Obviamente, o H100 tem um rival digno, que, além disso, tem menor custo e maior disponibilidade. Mas a própria NVIDIA já apresentou chips (G)H200, e a AMD está preparando o Instinct MI300.

Os sistemas baseados em Intel Max estão disponíveis em vários formatos: tanto na Intel Developer Cloud quanto como parte de soluções OEM. A Supermicro oferece um servidor com oito módulos OAM, enquanto Dell e Lenovo oferecem soluções com quatro aceleradores no mesmo formato. A variante PCIe Max 1100 está disponível nos fabricantes acima, bem como na HPE.

Além dos aceleradores Max, a Intel também forneceu novos dados sobre o desempenho dos coprocessadores Gaudi2 AI. A empresa continua a melhorar e otimizar ativamente o ecossistema de software Gaudi. Como resultado, no sistema de inferência baseado no modelo GPT-J-6B, os resultados dos aceleradores Gaudi2 já são comparáveis ​​aos do NVIDIA H100 (SXM 80 GB), e o A100 é significativamente inferior ao Gaudi2 e ao Max 1550.

Mas o mais interessante são as informações sobre os planos para a próxima geração de Gaudí. Sabe-se agora que Gaudi3 será produzido usando um processo de 5 nm. O novo chip será quatro vezes mais rápido nos cálculos do BF16 e também terá um subsistema de memória duas vezes mais potente e 1,5 vezes mais memória HBM. Deverá ver a luz do dia em 2024.

Ao mesmo tempo, a empresa lembrou que os processadores Xeon Emerald Rapids serão apresentados exatamente em um mês, e Granite Rapids aparecerá em 2024. Em 2025 aparecerá o chip Falcon Shores, que, segundo a Intel, agora deve combinar uma GPU e um coprocessador de IA. Ele combinará as arquiteturas Habana e Xe em uma única solução com layout baseado em blocos, memória HBM3 e suporte completo a CXL.

Fonte da imagem: Intel via Phoronix

Deve-se notar que tal unificação é bastante real: a Intel está desenvolvendo ativamente uma pilha de tecnologia universal, flexível e aberta no âmbito do projeto oneAPI. Inclui todas as ferramentas necessárias – desde compiladores e bibliotecas de sistema até ferramentas de integração com mecanismos populares de análise de dados, modelos e bibliotecas de inteligência artificial.

avalanche

Postagens recentes

Novembro TOP500: amanhecer tardio da Intel

A última, 62ª edição do ranking TOP500 dos supercomputadores mais produtivos do mundo entre aqueles…

3 minutos atrás

Joby Aviation faz voo de teste de avião elétrico em Nova York

Coordenando com as autoridades de cada região a possibilidade de operar aeronaves elétricas, seus desenvolvedores…

2 horas atrás

As importações de equipamentos de fabricação de chips para a China quase dobraram no último trimestre

As estatísticas de Outubro por si só já demonstraram a disponibilidade das empresas chinesas para…

4 horas atrás

A desmontagem do Steam Deck OLED mostrou uma reformulação completa de seu circuito

A Valve fez um trabalho significativo para otimizar os circuitos do console de jogos portátil…

5 horas atrás

Amazon vai demitir mais 180 funcionários de games, mas vai focar na distribuição gratuita de jogos Prime Gaming

A divisão de jogos da gigante da tecnologia Amazon espera sua segunda redução de pessoal…

9 horas atrás