A Intel mostrou os resultados dos testes do acelerador Max 1550 e falou sobre os futuros chips Gaudi3 e Falcon Shores

No SC23, a Intel mostrou vários slides interessantes. Eles contêm resultados de testes do acelerador Max 1550 com arquitetura Xe, bem como planos para a próxima geração de aceleradores Gaudi AI.

Imagem: Intel

Ao mesmo tempo, a empresa adotou uma abordagem diferente da habitual – em vez de demonstrar os resultados obtidos dentro das paredes da própria Intel, a palavra foi dada ao Laboratório Nacional de Argonne do Departamento de Energia dos EUA, onde neste verão foi realizada a instalação do O supercomputador da ex-classe Aurora, que atualmente ocupa o segundo lugar no TOP500, foi concluído.

Este cluster HPC utiliza módulos OAM Max 1550 (Ponte Vecchio) com pacote térmico de 600 W. Eles contêm 128 núcleos Xe e 128 GB de memória HBM2E. A interface Xe Link permite que até oito desses módulos se comuniquem diretamente, proporcionando escalabilidade mais eficiente.

Fonte das imagens aqui e abaixo: Intel via ServeTheHome

Embora o ajuste do complexo de computação Aurora ainda esteja em andamento, já existem dados sobre o desempenho do Max 1550 em comparação com o AMD Instinct MI250 e NVIDIA A100. No teste de alta física de partículas usando a combinação PyTorch + Horovod (precisão de cálculo FP32), os aceleradores Intel ficaram em primeiro lugar com confiança e também mostraram 83% de eficiência de escala em 512 nós Aurora.

Num teste que simula o comportamento de um complexo de nanopartículas de silício, os aceleradores Max 1550 também saíram em primeiro lugar, tanto em termos absolutos como no teste de 128 nós, em comparação com o Polaris (quatro A100 por nó) e o Frontier (quatro Sistemas MI250 por nó). Escrito usando Fortran e OpenMP, o código provou funcionar ao ser dimensionado para mais de 500 nós de computação do Aurora.

Fonte da imagem: Intel via Phoronix

Em geral, os aceleradores Intel Max 1550 apresentam bons resultados e não são inferiores aos NVIDIA H100: em algumas tarefas sua eficiência relativa é de pelo menos 0,82, mas na maioria dos outros testes esse valor varia de 1,0 a 3,76. Obviamente, o H100 tem um rival digno, que, além disso, tem menor custo e maior disponibilidade. Mas a própria NVIDIA já apresentou chips (G)H200, e a AMD está preparando o Instinct MI300.

Os sistemas baseados em Intel Max estão disponíveis em vários formatos: tanto na Intel Developer Cloud quanto como parte de soluções OEM. A Supermicro oferece um servidor com oito módulos OAM, enquanto Dell e Lenovo oferecem soluções com quatro aceleradores no mesmo formato. A variante PCIe Max 1100 está disponível nos fabricantes acima, bem como na HPE.

Além dos aceleradores Max, a Intel também forneceu novos dados sobre o desempenho dos coprocessadores Gaudi2 AI. A empresa continua a melhorar e otimizar ativamente o ecossistema de software Gaudi. Como resultado, no sistema de inferência baseado no modelo GPT-J-6B, os resultados dos aceleradores Gaudi2 já são comparáveis ​​aos do NVIDIA H100 (SXM 80 GB), e o A100 é significativamente inferior ao Gaudi2 e ao Max 1550.

Mas o mais interessante são as informações sobre os planos para a próxima geração de Gaudí. Sabe-se agora que Gaudi3 será produzido usando um processo de 5 nm. O novo chip será quatro vezes mais rápido nos cálculos do BF16 e também terá um subsistema de memória duas vezes mais potente e 1,5 vezes mais memória HBM. Deverá ver a luz do dia em 2024.

Ao mesmo tempo, a empresa lembrou que os processadores Xeon Emerald Rapids serão apresentados exatamente em um mês, e Granite Rapids aparecerá em 2024. Em 2025 aparecerá o chip Falcon Shores, que, segundo a Intel, agora deve combinar uma GPU e um coprocessador de IA. Ele combinará as arquiteturas Habana e Xe em uma única solução com layout baseado em blocos, memória HBM3 e suporte completo a CXL.

Fonte da imagem: Intel via Phoronix

Deve-se notar que tal unificação é bastante real: a Intel está desenvolvendo ativamente uma pilha de tecnologia universal, flexível e aberta no âmbito do projeto oneAPI. Inclui todas as ferramentas necessárias – desde compiladores e bibliotecas de sistema até ferramentas de integração com mecanismos populares de análise de dados, modelos e bibliotecas de inteligência artificial.

avalanche

Postagens recentes

A Honda registrou prejuízo pela primeira vez desde 1957, já que sua estratégia de veículos elétricos se mostrou contraproducente.

A montadora japonesa Honda Motor anunciou seu primeiro prejuízo operacional desde sua abertura de capital…

2 horas atrás

O valor de mercado da Take-Two aumentou em quase US$ 3 bilhões em meio a rumores de que as pré-vendas de GTA VI estão prestes a começar.

Os rumores sobre o lançamento iminente da pré-venda do ambicioso thriller de mundo aberto e…

2 horas atrás

A China criou um computador quântico fotônico que os supercomputadores não conseguem alcançar, nem mesmo durante a existência do universo.

Cientistas chineses criaram uma nova versão do computador quântico fotônico Jiuzhang, apresentado pela primeira vez…

3 horas atrás

A Microsoft está preparando um controle Xbox Elite Series 3 de última geração com volante e Wi-Fi.

A Anatel, agência reguladora brasileira, divulgou imagens do próximo controle Xbox Elite, que apresenta diversas…

3 horas atrás

As vendas do sucesso pirata Windrose ultrapassaram dois milhões de cópias em um mês no Acesso Antecipado do Steam.

Os desenvolvedores do estúdio uzbeque Kraken Express relataram novos sucessos para seu simulador de sobrevivência…

3 horas atrás