Na ISC 2021 Supercomputing Conference and Exhibition, a Intel apresentou suas mais recentes soluções de computação de alto desempenho (HPC) e também mencionou brevemente produtos futuros. A combinação das novas plataformas de processador escalável Xeon, aceleradores Ponte Vecchio baseados em Intel Xe e adaptadores Ethernet série 800/810 deve colocar a empresa em uma posição forte no mundo HPC.
Nos últimos anos, surgiram no setor de HPC soluções baseadas em EPYC de 64 núcleos e, em seguida, desenvolvimentos baseados na arquitetura ARM, que mostraram alto desempenho específico e eficiência energética. Ao mesmo tempo, a plataforma Intel® Xeon®, embora fosse progressiva em vários aspectos – basta lembrar o suporte exclusivo para memória Optane ™ e instruções AVX-512 – mas o número de núcleos por processador ao nível de os concorrentes não podiam ser aumentados e a plataforma híbrida Xeon 9200 não era popular, venceu por uma série de razões.
Mas agora a situação está começando a mudar a favor da Intel. Embora a terceira geração do Xeon Escalável (Ice Lake-SP) tenha sido atrasada, acabou sendo bastante interessante: os novos processadores têm suporte para enclaves de computação realmente sérios em termos de volume protegido, barramento PCIe 4.0, desenvolvimento de AVX-512 e VNNI, controlador de memória DDR4-3200 de oito canais e o número máximo de núcleos ao mesmo tempo aumentou de 28 para 40, que é de alguma forma comparável ao EPYC da segunda e terceira gerações.

Apesar de algum atraso na contagem de núcleos brutos, os processadores Xeon escaláveis de terceira geração, de acordo com a Intel, têm um bom desempenho em vários aplicativos HPC devido à microarquitetura aprimorada e ao suporte para extensões e VNNI. Conforme relatado pela Intel, o processador Xeon Platinum 8358 (10nm, 32C / 64T, 2,6 – 3,4 GHz, 48 MB de cache, 250 W TDP) supera significativamente o desempenho do AMD EPYC 7543 (7 nm, 32C / 64T, 2,8 – 3,7 GHz, 256 MB de cache , 225 W TDP) especificamente no campo de HPC: nos testes NAMD a vantagem foi de 62%, os pacotes LAMMPS e RELION apresentaram uma vantagem de 57% e 68%, respectivamente, e no teste Binominal Options o ganho foi de 37% …

Além disso, as simulações de Monte Carlo, frequentemente usadas em aplicativos financeiros, são executadas duas vezes mais rápido no Xeon escalável de terceira geração. O Xeon Platinum 8380 (10 nm, 40C / 80T, 2,3 – 3,4 GHz, 60 MB de cache, 270 W TDP) também teve um desempenho excelente: nos 20 testes de IA mais populares, ele superou o EPYC 7763 (7 nm, 64C / 128T, 2,45 – 3,5 GHz, cache de 256 MB, 280 W TDP) em 50%. Este exemplo é uma boa prova do fato de que o número de núcleos e a capacidade de computação “bruta” não garantem a vitória, e a presença de otimizações de hardware e software pode ser decisiva em uma série de problemas.

Cargas computacionais no campo da modelagem e simulação, como modelagem do comportamento de fluidos ou cromodinâmica quântica, problemas de aprendizado de máquina, bancos de dados de classe em memória, são altamente dependentes do desempenho dos subsistemas de memória. E aqui a Intel também tem algo a dizer. Tendo testado anteriormente a tecnologia de memória embutida de alta velocidade na plataforma Xeon Phi ™ 7200 (até 16 GB 3D MCDRAM), a empresa vai retornar a essa ideia em um novo nível: os processadores de codinome Sapphire Rapids não receberão apenas suporte DDR5, mas também HBM2 integrado (até 64 GB).

Combinado com o suporte PCI Express 5.0 e novas extensões de matriz avançada, isso torna o Xeon (Sapphire Rapids) uma plataforma muito atraente para o segmento de HPC. E grandes clientes já estão interessados na novidade do futuro: esses processadores estão planejados para serem usados nos supercomputadores Aurora, Crossroads e SuperMUC-NG. Representantes dessas e de várias outras organizações de pesquisa estão muito otimistas sobre a plataforma Sapphire Rapids.

Em várias máquinas, eles serão acompanhados por aceleradores Intel Xe Ponte Vecchio, que já estão em processo de validação como parte de novos sistemas. Lembre-se de que cada nó do supracitado supercomputador Aurora deve receber dois processadores Sapphire Rapids e seis aceleradores Ponte Vecchio. O surgimento de um novo player no mercado abrirá oportunidades adicionais para fabricantes de sistemas no segmento de HPC.

Os próprios aceleradores da Ponte Vecchio são únicos: o chip é uma estrutura multicomponente bastante intrincada, consistindo em 47 elementos e conectados entre si usando as tecnologias Foveros 3D e EMIB. Não é surpreendente, já que o número total de transistores neste monstro ultrapassa 100 bilhões, o que permite à Intel esperar um nível de desempenho de mais de 1 Pflops. Este acelerador estará disponível no formato OCP Accelerator Module (OAM). Sabe-se também que receberá refrigeração líquida.

Finalmente, o terceiro componente importante de qualquer plataforma HPC: o data warehouse. Nesta área, a Intel aposta em soluções abertas e no ISC 2021 a empresa apresentou uma versão comercial do DAOS (Distributed Application Object Storage). A plataforma DAOS é definida por software, mas isso não é uma indicação de seu baixo desempenho. Ao contrário, foi originalmente criado com foco na escalabilidade e no mais alto nível de desempenho precisamente com grandes quantidades de dados.

Em sistemas DAOS, a Intel usa apenas memória de estado sólido, abandonando esquemas híbridos usando drives mecânicos tradicionais e SSDs, e Optane também é compatível com ambas as encarnações: drives e módulos PMem. A Intel disponibilizou o DAOS como uma solução L3 para seus parceiros. Isso inclui gigantes como HPE, Lenovo, Supermicro, Brightskies, Croit, Nettrix, Quanta, bem como o RSC russo, que apoiou a iniciativa DAOS no final do ano passado.

Finalmente, outro componente importante dos sistemas HPC é a interconexão. A Intel, como nos lembramos, abandonou o Omni-Path, concentrando-se na Ethernet. E no ISC 2021, a empresa anunciou sua plataforma High Performance Networking (HPN), que inclui adaptadores da série 100 / 200GbE E800 / E810, switches Tofino ™ e software Intel Ethernet Fabric. Isso é suficiente para construir pequenos clusters e, como a empresa promete, o desempenho ficará no nível das soluções InfiniBand e o custo será menor que o deles.

No geral, a Intel adota uma abordagem holística. Se, ao construir um sistema HPC baseado em soluções de outros fabricantes, você ainda tiver que usar componentes de hardware ou software “de fora”, então a Intel está pronta para oferecer tudo em um complexo, de processadores e aceleradores computacionais a adaptadores de rede, switches e software. Como parte do desenvolvimento do modelo oneAPI pela Intel, o último ponto é de particular interesse.
