A Intel mostrou os resultados dos testes do acelerador Max 1550 e falou sobre os futuros chips Gaudi3 e Falcon Shores

No SC23, a Intel mostrou vários slides interessantes. Eles contêm resultados de testes do acelerador Max 1550 com arquitetura Xe, bem como planos para a próxima geração de aceleradores Gaudi AI.

Imagem: Intel

Ao mesmo tempo, a empresa adotou uma abordagem diferente da habitual – em vez de demonstrar os resultados obtidos dentro das paredes da própria Intel, a palavra foi dada ao Laboratório Nacional de Argonne do Departamento de Energia dos EUA, onde neste verão foi realizada a instalação do O supercomputador da ex-classe Aurora, que atualmente ocupa o segundo lugar no TOP500, foi concluído.

Este cluster HPC utiliza módulos OAM Max 1550 (Ponte Vecchio) com pacote térmico de 600 W. Eles contêm 128 núcleos Xe e 128 GB de memória HBM2E. A interface Xe Link permite que até oito desses módulos se comuniquem diretamente, proporcionando escalabilidade mais eficiente.

Fonte das imagens aqui e abaixo: Intel via ServeTheHome

Embora o ajuste do complexo de computação Aurora ainda esteja em andamento, já existem dados sobre o desempenho do Max 1550 em comparação com o AMD Instinct MI250 e NVIDIA A100. No teste de alta física de partículas usando a combinação PyTorch + Horovod (precisão de cálculo FP32), os aceleradores Intel ficaram em primeiro lugar com confiança e também mostraram 83% de eficiência de escala em 512 nós Aurora.

Num teste que simula o comportamento de um complexo de nanopartículas de silício, os aceleradores Max 1550 também saíram em primeiro lugar, tanto em termos absolutos como no teste de 128 nós, em comparação com o Polaris (quatro A100 por nó) e o Frontier (quatro Sistemas MI250 por nó). Escrito usando Fortran e OpenMP, o código provou funcionar ao ser dimensionado para mais de 500 nós de computação do Aurora.

Fonte da imagem: Intel via Phoronix

Em geral, os aceleradores Intel Max 1550 apresentam bons resultados e não são inferiores aos NVIDIA H100: em algumas tarefas sua eficiência relativa é de pelo menos 0,82, mas na maioria dos outros testes esse valor varia de 1,0 a 3,76. Obviamente, o H100 tem um rival digno, que, além disso, tem menor custo e maior disponibilidade. Mas a própria NVIDIA já apresentou chips (G)H200, e a AMD está preparando o Instinct MI300.

Os sistemas baseados em Intel Max estão disponíveis em vários formatos: tanto na Intel Developer Cloud quanto como parte de soluções OEM. A Supermicro oferece um servidor com oito módulos OAM, enquanto Dell e Lenovo oferecem soluções com quatro aceleradores no mesmo formato. A variante PCIe Max 1100 está disponível nos fabricantes acima, bem como na HPE.

Além dos aceleradores Max, a Intel também forneceu novos dados sobre o desempenho dos coprocessadores Gaudi2 AI. A empresa continua a melhorar e otimizar ativamente o ecossistema de software Gaudi. Como resultado, no sistema de inferência baseado no modelo GPT-J-6B, os resultados dos aceleradores Gaudi2 já são comparáveis ​​aos do NVIDIA H100 (SXM 80 GB), e o A100 é significativamente inferior ao Gaudi2 e ao Max 1550.

Mas o mais interessante são as informações sobre os planos para a próxima geração de Gaudí. Sabe-se agora que Gaudi3 será produzido usando um processo de 5 nm. O novo chip será quatro vezes mais rápido nos cálculos do BF16 e também terá um subsistema de memória duas vezes mais potente e 1,5 vezes mais memória HBM. Deverá ver a luz do dia em 2024.

Ao mesmo tempo, a empresa lembrou que os processadores Xeon Emerald Rapids serão apresentados exatamente em um mês, e Granite Rapids aparecerá em 2024. Em 2025 aparecerá o chip Falcon Shores, que, segundo a Intel, agora deve combinar uma GPU e um coprocessador de IA. Ele combinará as arquiteturas Habana e Xe em uma única solução com layout baseado em blocos, memória HBM3 e suporte completo a CXL.

Fonte da imagem: Intel via Phoronix

Deve-se notar que tal unificação é bastante real: a Intel está desenvolvendo ativamente uma pilha de tecnologia universal, flexível e aberta no âmbito do projeto oneAPI. Inclui todas as ferramentas necessárias – desde compiladores e bibliotecas de sistema até ferramentas de integração com mecanismos populares de análise de dados, modelos e bibliotecas de inteligência artificial.

avalanche

Postagens recentes

Óculos inteligentes Ray-Ban Meta ganham “IA ao vivo”, tradutor em tempo real e Shazam

Meta✴ expandiu a funcionalidade dos óculos inteligentes Ray-Ban Meta✴, adicionando suporte para “AI viva”, um…

51 segundos atrás

A placa Asus ROG Strix B860-A para o próximo Arrow Lake-S mais acessível apareceu em vídeo

A Asus, como outros fabricantes de placas-mãe, ainda não anunciou modelos de segmento de preço…

31 minutos atrás

OpenAI desafiou o Google: pesquisa na Internet via ChatGPT aberta a todos os usuários

A OpenAI abriu hoje a busca na Internet por meio do chatbot com inteligência artificial…

51 minutos atrás

O lendário processador Intel 8080 completa 50 anos

A Intel está comemorando o 50º aniversário do lançamento do lendário processador Intel 8080. Nesta…

1 hora atrás