Categorias: Mercado de tecnologia e TI. notícia

A Intel mostrou os resultados dos testes do acelerador Max 1550 e falou sobre os futuros chips Gaudi3 e Falcon Shores

No SC23, a Intel mostrou vários slides interessantes. Eles contêm resultados de testes do acelerador Max 1550 com arquitetura Xe, bem como planos para a próxima geração de aceleradores Gaudi AI.

Imagem: Intel

Ao mesmo tempo, a empresa adotou uma abordagem diferente da habitual – em vez de demonstrar os resultados obtidos dentro das paredes da própria Intel, a palavra foi dada ao Laboratório Nacional de Argonne do Departamento de Energia dos EUA, onde neste verão foi realizada a instalação do O supercomputador da ex-classe Aurora, que atualmente ocupa o segundo lugar no TOP500, foi concluído.

Este cluster HPC utiliza módulos OAM Max 1550 (Ponte Vecchio) com pacote térmico de 600 W. Eles contêm 128 núcleos Xe e 128 GB de memória HBM2E. A interface Xe Link permite que até oito desses módulos se comuniquem diretamente, proporcionando escalabilidade mais eficiente.

Fonte das imagens aqui e abaixo: Intel via ServeTheHome

Embora o ajuste do complexo de computação Aurora ainda esteja em andamento, já existem dados sobre o desempenho do Max 1550 em comparação com o AMD Instinct MI250 e NVIDIA A100. No teste de alta física de partículas usando a combinação PyTorch + Horovod (precisão de cálculo FP32), os aceleradores Intel ficaram em primeiro lugar com confiança e também mostraram 83% de eficiência de escala em 512 nós Aurora.

Num teste que simula o comportamento de um complexo de nanopartículas de silício, os aceleradores Max 1550 também saíram em primeiro lugar, tanto em termos absolutos como no teste de 128 nós, em comparação com o Polaris (quatro A100 por nó) e o Frontier (quatro Sistemas MI250 por nó). Escrito usando Fortran e OpenMP, o código provou funcionar ao ser dimensionado para mais de 500 nós de computação do Aurora.

Fonte da imagem: Intel via Phoronix

Em geral, os aceleradores Intel Max 1550 apresentam bons resultados e não são inferiores aos NVIDIA H100: em algumas tarefas sua eficiência relativa é de pelo menos 0,82, mas na maioria dos outros testes esse valor varia de 1,0 a 3,76. Obviamente, o H100 tem um rival digno, que, além disso, tem menor custo e maior disponibilidade. Mas a própria NVIDIA já apresentou chips (G)H200, e a AMD está preparando o Instinct MI300.

Os sistemas baseados em Intel Max estão disponíveis em vários formatos: tanto na Intel Developer Cloud quanto como parte de soluções OEM. A Supermicro oferece um servidor com oito módulos OAM, enquanto Dell e Lenovo oferecem soluções com quatro aceleradores no mesmo formato. A variante PCIe Max 1100 está disponível nos fabricantes acima, bem como na HPE.

Além dos aceleradores Max, a Intel também forneceu novos dados sobre o desempenho dos coprocessadores Gaudi2 AI. A empresa continua a melhorar e otimizar ativamente o ecossistema de software Gaudi. Como resultado, no sistema de inferência baseado no modelo GPT-J-6B, os resultados dos aceleradores Gaudi2 já são comparáveis aos do NVIDIA H100 (SXM 80 GB), e o A100 é significativamente inferior ao Gaudi2 e ao Max 1550.

Mas o mais interessante são as informações sobre os planos para a próxima geração de Gaudí. Sabe-se agora que Gaudi3 será produzido usando um processo de 5 nm. O novo chip será quatro vezes mais rápido nos cálculos do BF16 e também terá um subsistema de memória duas vezes mais potente e 1,5 vezes mais memória HBM. Deverá ver a luz do dia em 2024.

Ao mesmo tempo, a empresa lembrou que os processadores Xeon Emerald Rapids serão apresentados exatamente em um mês, e Granite Rapids aparecerá em 2024. Em 2025 aparecerá o chip Falcon Shores, que, segundo a Intel, agora deve combinar uma GPU e um coprocessador de IA. Ele combinará as arquiteturas Habana e Xe em uma única solução com layout baseado em blocos, memória HBM3 e suporte completo a CXL.

Fonte da imagem: Intel via Phoronix

Deve-se notar que tal unificação é bastante real: a Intel está desenvolvendo ativamente uma pilha de tecnologia universal, flexível e aberta no âmbito do projeto oneAPI. Inclui todas as ferramentas necessárias – desde compiladores e bibliotecas de sistema até ferramentas de integração com mecanismos populares de análise de dados, modelos e bibliotecas de inteligência artificial.

avalanche

Próximo Novembro TOP500: amanhecer tardio da Intel »

Anterior « Joby Aviation faz voo de teste de avião elétrico em Nova York

Deixar comentário

Publicado por

avalanche

6 minutos atrás

Postagens recentes

Mercado de tecnologia e TI. notícia

A Intel mostrou os resultados dos testes do acelerador Max 1550 e falou sobre os futuros chips Gaudi3 e Falcon Shores

Postagens recentes

Novembro TOP500: amanhecer tardio da Intel

Joby Aviation faz voo de teste de avião elétrico em Nova York

As importações de equipamentos de fabricação de chips para a China quase dobraram no último trimestre

A desmontagem do Steam Deck OLED mostrou uma reformulação completa de seu circuito

Amazon vai demitir mais 180 funcionários de games, mas vai focar na distribuição gratuita de jogos Prime Gaming

NVIDIA apresentou o H200 – o acelerador de computação mais rápido do mundo para a IA mais poderosa

A Intel mostrou os resultados dos testes do acelerador Max 1550 e falou sobre os futuros chips Gaudi3 e Falcon Shores

Conteúdo relacionado

Postagens recentes

Novembro TOP500: amanhecer tardio da Intel

Joby Aviation faz voo de teste de avião elétrico em Nova York

As importações de equipamentos de fabricação de chips para a China quase dobraram no último trimestre

A desmontagem do Steam Deck OLED mostrou uma reformulação completa de seu circuito

Amazon vai demitir mais 180 funcionários de games, mas vai focar na distribuição gratuita de jogos Prime Gaming

NVIDIA apresentou o H200 – o acelerador de computação mais rápido do mundo para a IA mais poderosa