Foto do dia: nós HPE Cray EX no supercomputador Frontier Exascale

O primeiro supercomputador ocidental a quebrar oficialmente a marca de 1 Eflops é conhecido como Frontier, um sistema criado pela HPE Cray e instalado no Oak Ridge National Laboratory (ORNL). Como os desenvolvedores de supercomputadores chineses não querem compartilhar oficialmente os resultados, é a Frontier que atualmente ocupa o primeiro lugar na classificação TOP500 com um desempenho máximo de 1.102 Eflops e um consumo de energia de pouco mais de 21 MW.

A configuração deste sistema não é segredo: seu sucesso está na combinação dos processadores AMD EPYC Milan, os mais poderosos aceleradores Instinct MI250X e a interconexão proprietária Cray Slingshot. Frontier consiste em 74 gabinetes contendo 9.408 nós de computação. Cada nó contém um processador central e quatro aceleradores.

Nó de fronteira. Os blocos de água dos aceleradores e módulos de memória Instinct MI250X são claramente visíveis. Fonte: HPCwire

Os jornalistas da HPCwire conseguiram olhar mais de perto o interior do recordista. Os componentes de cada nó Frontier são resfriados com um meio de transferência de calor líquido (CoolIT CoolIT), o que possibilitou atingir uma potência tão impressionante em apenas 74 gabinetes de equipamentos. A densidade dos recursos computacionais é realmente impressionante.

Entrevista dada pelo líder do projeto Frontier, Justin Whitt, à HPCwire

As primeiras entregas de equipamentos para o canteiro de obras da Frontier começaram em outubro do ano passado, e em junho deste ano já conquistou o TOP500, então o tempo de construção e comissionamento da Frontier é impressionante. O ajuste e a depuração, de acordo com a equipe do ORNL, tiveram que ser feitos em um ritmo forçado, fazendo alterações no sistema durante o dia e executando testes de verificação à noite.

O layout geral da Fronteira. Fonte: HPCwire

Os recursos do site para Frontier excedem um pouco suas necessidades atuais – o data center foi projetado para 40 MW, dos quais apenas cerca de 29 estão em uso no momento. No entanto, o sistema é muito inteligente e pode se ajustar dinamicamente à carga e até o nível de um único nó de computação. O sistema de monitoramento fornece ainda mais detalhes e leva em consideração, por exemplo, o desempenho de cada GPU individual.

Na sala de máquinas da Frontier. Fonte: HPCwire

Ao contrário de suas contrapartes clássicas refrigeradas a ar, o Frontier é muito silencioso e é bem possível estar em seu salão sem fones de ouvido de proteção. Praticamente todo o ruído emitido é gerado por armazenamentos de dados refrigerados a ar. Devido ao seu tamanho compacto, o Frontier, oficialmente chamado de OLCF-5, provavelmente dividirá a sala de máquinas com seu sucessor, o OLCF-6.

avalanche

Postagens recentes

A VK Tech lançou a plataforma VK AI Space para que empresas criem e implementem agentes de IA.

A VK Tech apresentou a plataforma VK AI Space, que permite o desenvolvimento e a…

29 minutos atrás

“Eu fui um tolo”: Elon Musk lamentou no tribunal sua decisão de dar dinheiro aos fundadores da OpenAI.

O processo judicial entre a OpenAI e Elon Musk, um dos fundadores da startup, está…

43 minutos atrás

A Cloudflare classificou seu aplicativo de mensagens Max como spyware e malware, e os desenvolvedores responderam.

Na Cloudflare Radar, uma plataforma pertencente à Cloudflare, uma das maiores provedoras de serviços de…

1 hora atrás

“Melhor jogar o primeiro jogo”: o shooter Industria 2 decepcionou os jogadores e foi lançado no Steam com uma avaliação de 56%.

A Bleakmill Studios, com o apoio da Headup, lançou o jogo de tiro e terror…

1 hora atrás