O Ohio Supercomputing Center (OSC) anunciou o Projeto Cardinal para criar um novo cluster para tarefas de HPC e IA. O sistema heterogêneo, construído em servidores Dell PowerEdge com processadores Intel, entrará em operação no segundo semestre de 2024.
O cluster incluirá nós equipados com processadores Xeon Max 9470 da família Sapphire Rapids. Esses chips contêm 52 núcleos (104 threads) com velocidade de clock máxima de 3,5 GHz e 128 GB de memória HBM2e. Um total de 756 desses processadores serão usados. Cada nó receberá 512 GB DDR5 e SSD NVMe com capacidade de 400 GB. Os nós fazem parte dos servidores Dell PowerEdge C6620. Eles serão acompanhados por 16 nós Dell PowerEdge R660, também com dois Xeon Max 9470, mas com 2 TB DDR5 e 12,8 TB NVMe SSD. Todos esses nós serão unidos pela interconexão 200G Infiniband.
Além disso, serão usados 32 nós Dell PowerEdge XE9640 com dois chips Xeon 8470 Platinum (52C/104T; até 3,8 GHz), quatro aceleradores NVIDIA H100 com 96 GB de memória HBM3 e 1 TB de DDR5. Fala sobre o uso de quatro conexões NVLink e da plataforma 400G Quantum-2 InfiniBand. O pico declarado de desempenho da IA (FP8) é de cerca de 500 Pflops.
O supercomputador fornecerá desempenho geral do FP64 de 10,5 Pflops. Assim, o cluster será aproximadamente 40% mais rápido que as três máquinas OSC atuais combinadas. Ao mesmo tempo, o Cardinal ocupa apenas nove racks e requer um par de CDUs para operar o LSS. Observa-se que Cardinal é o resultado da colaboração entre OSC, Dell Technologies, Intel e NVIDIA. O novo supercomputador substituirá o sistema Owens, utilizado na OSC desde 2016.