Como Aurora, mas menor: supercomputador de treinamento Sunspot lançado em chips Intel Max

Um dos maiores projetos na área de computação de alto desempenho (HPC), o supercomputador 2-Eflops Aurora, que o Argonne National Laboratory (ANL) planeja inaugurar em breve, recebeu mais uma plataforma de teste. O novo minicluster Sunspot, que inclui dois racks da futura máquina, é um excelente campo de testes para depuração de software.

O Aurora consistirá em mais de 10.000 nós de computação e o Sunspot terá 128 nós, cada um dos quais, no entanto, possui uma configuração muito séria. A bordo, esse nó carrega um par de processadores Intel Xeon Max (Sapphire Rapids + 64 GB HBM2e), bem como seis aceleradores Intel Max Series (Ponte Vecchio). A Sunspot usa a rede proprietária HPE/Cray Slingshot de última geração como uma interconexão.

Fonte: Argonne Leadership Computing Facility

De acordo com o chefe do Argonne Leadership Computing Facility (ALCF), a identidade completa das arquiteturas permitirá que os desenvolvedores otimizem o código para maximizar todos os recursos do Sapphire Rapids e da Ponte Vecchio. Anteriormente, os clusters Iris, Arcticus, Florentia do próprio laboratório Argonne, bem como o Borealis, de propriedade da Intel, serviam como plataformas de teste. O Sunspot foi lançado em dezembro e, desde então, foi acessado por mais de 180 pesquisadores de 20 equipes de desenvolvimento por meio do Aurora Early Science Program (ESP) e Exascale Computing Project (ECP).

O processo de construção do Aurora está em pleno andamento

Nota-se que os resultados alcançados no hardware Intel Max são encorajadores. Em uma série de tarefas científicas e técnicas, o ganho de desempenho ao mudar para aceleradores Intel variou de 20 a 70%, e no código de cosmologia acelerada por hardware/híbrido desenvolvido pelos Argonnes, o ganho chegou a 2,6 vezes. Espera-se que uma otimização mais refinada melhore os resultados. Curiosamente, mesmo após o lançamento do Aurora, o sistema Sunspot não será desmontado, mas se tornará, como todas as plataformas de teste ALCF anteriores, um “campo de testes público para iniciantes”.

avalanche

Postagens recentes

Seagate reforma mais de 1 milhão de unidades, livrando o planeta de 540 toneladas de lixo eletrônico

A Seagate Technology Holdings anunciou que alcançou mais de 50% de sua meta de 100%…

10 minutos atrás

Os processadores Intel encontraram outra vulnerabilidade para roubo de dados por meio de canais de terceiros

Foi descoberto um novo hack de canal lateral que afeta várias gerações de processadores Intel.…

2 horas atrás

Dono do TikTok pretende desafiar Tencent para jogos mobile na China

A ByteDance, proprietária da TikTok e da desenvolvedora de jogos para celular Moonton, planeja competir…

2 horas atrás