A 65ª edição do TOP500 dos supercomputadores mais poderosos do mundo não apresentou nenhuma surpresa especial, mas algumas máquinas novas e interessantes entraram. Os líderes da lista entre os países ainda são os EUA (175 sistemas) e a China (47 sistemas), mas suas contribuições são completamente diferentes. Os três primeiros colocados ainda são representados pelos supercomputadores exascale El Capitan, Frontier e Aurora, do Departamento de Energia dos EUA (DoE). Não há sistemas chineses dessa classe na lista, embora ninguém duvide de sua existência. Pior ainda, nenhuma inscrição foi enviada pela China desta vez.

Agora, a Alemanha está se aproximando da China em termos de número de posições no TOP500 – 41 máquinas, e uma delas subiu para o quarto lugar na edição de junho da lista. É também a única recém-chegada entre as dez primeiras. Trata-se do JUPITER Booster, um projeto conjunto da EuroHPC e do Centro de Supercomputação de Jülich. O JUPITER (Jupiter Pioneer for Innovative and Transformative Exascale Research) se tornará o primeiro supercomputador exascale europeu. Além disso, trata-se inicialmente de um sistema modular, do qual uma “peça”, chamada JETI (Jupiter Exascale Transition Instrument), já figurou no TOP500 do ano passado.

Fonte da imagem: Forschungszentrum Jülich / Sascha Kreklau

O JUPITER Booster ainda utiliza a plataforma Atos/Eviden BullSequana XH3000 com aceleradores híbridos NVIDIA Quad GH200 e interconexão InfiniBand NDR200. O desempenho em FP64 do segmento TOP500 (apenas uma parte da máquina inteira) foi de 793,4 Pflops, com um pico teórico de 930 Pflops. O consumo de energia é um pouco superior a 13 MW, mas, ao mesmo tempo, a máquina ocupa apenas a 21ª posição no GREEN500. E em primeiro lugar está o sistema JEDI, exatamente na mesma plataforma de hardware, o que não é surpreendente, pois também é um “pedaço” do JUPITER.

Fonte da imagem: Forschungszentrum Jülich / Sascha Kreklau

Em 11º lugar ficou outro supercomputador “montado” – a segunda fase do britânico Isambard-AI, baseado no NVIDIA GH200, que atingiu a marca de 216,5 Pflops (pico de 278,6 Pflops). O 13º lugar ficou com o sistema holandês ISEG2 da Nebius (antiga Yandex), baseado no Xeon Platinum 8468 (Sapphire Rapids), NVIDIA H200 (141 GB) e InfiniBand NDR400. Uma surpresa foi o aparecimento de dois sistemas baseados nos aceleradores vetoriais SX-Aurora Tipo 10AE, cujo desenvolvimento a NEC já abandonou. Duas máquinas sem nome, nas posições 113 e 157, pertencem aos meteorologistas alemães Deutscher Wetterdienst.

No final da lista, há mais dois sistemas curiosos da Noruega, também sem nome. Eles são interessantes porque foram fabricados pela xFusion (antiga divisão de servidores da Huawei, posteriormente desmembrada e vendida), equipados com processadores Intel Xeon 6900P (Granite Rapids-AP) e AMD EPYC 9005 (Turim) e… uma interconexão Intel Omni-Path de 100G. Recentemente, a Cornelis Networks alcançou os demais desenvolvedores de interconexão, finalmente apresentando a geração CN5000 de 400G. Em geral, a situação mudou pouco. 54,2% de todos os sistemas na lista atual dependem de InfiniBand e pouco mais de um terço de todas as gerações dependem de Ethernet.

Fonte: TOP500

Mas se contarmos por fracassos, 48,2% recaem sobre o Slingshot, ou seja, quase inteiramente sobre sistemas HPE, cujo desempenho total representa 47,9% do desempenho de toda a lista TOP500. O segundo lugar neste indicador pertence à Atos/Eviden. Em termos de número de supercomputadores na lista, a HPE ocupa apenas o segundo lugar, atrás da Lenovo e à frente da Dell. Em outras palavras, a HPE e a Atos/Eviden lidam principalmente com máquinas grandes, enquanto a Lenovo, a Dell e até mesmo a própria NVIDIA ocupam mais espaço em números.

Fonte: TOP500

No benchmark HPCG, a El Capitan assumiu a liderança com 17.407 EFLOPS, o que fez com que os demais participantes descessem uma posição, conquistando o primeiro lugar da Fugaku, que manteve por vários anos consecutivos. No benchmark de precisão mista HPL-MxP (HPL-AI), os primeiros lugares foram novamente para El Capitan, Aurora e Frontier, com 16,7 EFLOPS, 11,6 EFLOPS e 11,4 EFLOPS, respectivamente.

Fonte da imagem: NVIDIA

É interessante que no TOP500 atual ainda haja apenas uma máquina com AMD Instinct MI300X, e entre os novos produtos há cada vez mais MI300A e NVIDIA GH200 (assim como os mais tradicionais H100/H200). Obviamente, os mais recentes NVIDIA B300 e Instinct MI325X podem não ter entrado na classificação, mas é possível que no futuro os fornecedores continuem a instalar aceleradores desatualizados, pelo menos da NVIDIA. O problema é que, nas novas gerações de chips, a NVIDIA se concentrou em cargas de trabalho de IA — a diferença entre GB200 e GB300 nos cálculos de FP64 é quase trinta vezes maior. A AMD supostamente está preparando o Instinct MI430X com suporte a FP64 e o MI450X sem ele.

Já nos anúncios dos supercomputadores de próxima geração baseados no Vera Rubin, a própria NVIDIA evita cuidadosamente a questão do desempenho “puro”, falando apenas de “resultados científicos” no caso do sistema Doudna. E no caso do Blue Lion, a empresa fala sobre “a fusão de simulações, dados e IA”. Talvez não seja exatamente isso que os cientistas estejam esperando.

By admin

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *