O supercomputador Aurora baseado em processadores Intel não conseguiu ultrapassar o supercomputador Frontier baseado em chips AMD no último ranking Top500 dos supercomputadores mais rápidos do mundo, ficando em segundo lugar. No entanto, a Aurora assumiu a liderança no benchmark HPL-MxP, projetado para avaliar o desempenho da IA. Assim, Aurora é o supercomputador de IA mais rápido do mundo, com desempenho de 10,6 AI Eflops.

Fonte da imagem: Laboratório Nacional de Argonne

O supercomputador Aurora ainda não consegue operar em plena capacidade. É relatado que a máquina enfrenta diversos problemas no funcionamento dos componentes, no sistema de refrigeração, erros operacionais e instabilidade da infraestrutura de rede. Aurora foi anunciada há nove anos. O sistema nunca foi montado na primeira iteração. A segunda versão do supercomputador foi anunciada há cinco anos, e os últimos componentes da máquina foram instalados há apenas 11 meses.

O supercomputador Aurora está dividido em 10.624 clusters, que juntos contêm 21.248 processadores centrais e 63.744 processadores gráficos. De acordo com os dados mais recentes, o Laboratório Nacional de Argonne (ANL), onde este supercomputador está instalado, novamente não conseguiu avaliar todo o seu potencial de desempenho no teste Linpack, cujos resultados são usados ​​para determinar a classificação Top500 dos supercomputadores mais potentes do mundo. mundo.

Com 87% dos componentes do Aurora em execução (9.234 clusters ativos de 10.624 disponíveis), o Aurora demonstrou desempenho de 1.012 Eflops, quebrando a barreira de desempenho exascale. Isso o consolidou em segundo lugar na lista Top500. A primeira classificação de desempenho da Aurora ocorreu há seis meses. Naquela época, o supercomputador tinha apenas metade de suas unidades computacionais disponíveis funcionando, o que lhe permitiu demonstrar um resultado de 585,34 Pflops.

Com potência total, espera-se que o Aurora seja mais rápido que o Frontier no teste de desempenho de computação Linpack. Contudo, o supercomputador ainda requer configuração adicional para atender às características declaradas. Com 1.206 EFLOPS, o Frontier é atualmente cerca de 19% mais rápido que o Aurora. No entanto, de acordo com o Tom’s Hardware, dada a escalabilidade linear, o Aurora ainda não seria capaz de vencer o Frontier mesmo depois de usar seus 13% de unidades de computação não utilizadas.

A Intel tem elogiado amplamente o desempenho máximo teórico do Aurora de 2 Eflops (Rpeak), mas o desempenho do supercomputador é medido pelo desempenho sustentado (Rmax). Frontier oferece 70% de seu desempenho máximo como desempenho sustentado no Linpack, enquanto Aurora oferece 51% de desempenho máximo sustentado. Talvez no futuro, depois de todas as melhorias necessárias, a situação mude para melhor. O Laboratório Nacional de Argonne espera que isso aconteça mais cedo ou mais tarde. Eles observam que a Aurora tem uma meta de desempenho contratual superior à da Frontier.

Mesmo assim, a Aurora conseguiu superar todos os concorrentes no teste de desempenho de IA de precisão mista HPL-MxP, onde alcançou um resultado de 10,6 EFLOPS usando 89% de suas unidades de computação. Este teste favorece cálculos de menor precisão (FP32 e FP16) do que Linpack (FP64). Acredita-se que o HPL-MxP reflete melhor o desempenho em cargas de trabalho de IA do mundo real e no número crescente de outros aplicativos associados a este ambiente. Por sua vez, o FP64 reflete em grande parte o desempenho dos sistemas relacionados com a computação científica.

No entanto, a liderança da Aurora em HPL-MxP pode ser prejudicada num futuro próximo. Aparecendo no horizonte está o supercomputador Alps do Swiss National Computer Center (CSCS), baseado nos superchips Nvidia Grace Hopper. Este sistema ainda não participou da classificação, mas seu desempenho de IA é de 20 Eflops. Espera-se que todos os 10.752 superchips Grace Hopper sejam instalados nele até o final de junho deste ano.

No teste HPCG (High Performance Conjugate Gradients), que também é mais representativo de aplicações de carga de trabalho do mundo real do que o Linpack, o supercomputador Aurora também teve um desempenho impressionante. Tendo em conta o trabalho de apenas 38,5% do total de unidades computacionais, ficou em terceiro lugar nesta prova. No benchmark Graph500, desenvolvido para avaliar o desempenho de sistemas ao trabalhar com grandes conjuntos de dados, o Aurora ficou em quinto lugar. Porém, aqui a ANL não indicou quanto do sistema foi utilizado para este teste.

Aurora não entrou na lista Green500 dos supercomputadores com maior eficiência energética, e isso não é de todo surpreendente. Seu pico de consumo de energia é de até 60 MW, o dobro do consumo de energia do Frontier (29 MW).

Já se passaram 10 meses desde a instalação dos últimos equipamentos incluídos no Aurora. No entanto, o sistema ainda não está totalmente operacional. A Tom’s Hardware contatou a Intel para esclarecer a situação.

«

O Argonne National Laboratory e a Intel ainda não estão prontos para falar sobre quando o Aurora estará totalmente operacional.

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *