O RSK Group, desenvolvedor russo líder de supercomputadores e sistemas para computação de alto desempenho (HPC), data centers, plataformas em nuvem e sistemas de armazenamento de dados (DSS), apresentou na exposição Innoprom-2022 uma versão atualizada de sua plataforma para computação periférica autônoma , que permite que você rapidamente, em uma hora, com a ajuda de duas pessoas, implante um cluster HPC em praticamente qualquer lugar.
A solução é acondicionada em vários contêineres (0,7 x 0,7 x 1,1 m) que podem ser transportados de forma independente e montados no local. Um contêiner contém a parte de computação real, o segundo – um módulo de distribuição de refrigerante totalmente integrado com uma unidade de controle e o terceiro, opcional – um UPS com inversor. Eles são complementados por um módulo de refrigeração externo compacto. Todo o sistema tem uma margem muito sólida para a possibilidade de remoção de calor – até 60 kW.
É verdade que agora não é necessário muito. A unidade de computação é na verdade uma cópia reduzida da plataforma RSK Tornado: 2 colunas com 10 slots. Portanto, a plataforma móvel permite combinar servidores Tornado com processadores x86-64 (AMD EPYC e Intel Xeon) e Elbrus (atualmente 8C/8CB, futuramente 16C) com qualquer nível TDP, servidores GPGPU (dois PCIe – acelerador por servidor , sem limites de TDP) e servidores de armazenamento (até 12 × M.2 All-Flash).
Na versão atual da plataforma, cada slot é projetado para 2 kW de carga térmica (e a mesma quantidade de energia), embora os servidores atuais caibam em uma média de 700-800 W, e os servidores de próxima geração exigirão um pouco mais do que 1 kW. O subsistema de energia tem dois domínios, um por coluna, e requer uma entrada monofásica CA 230 V/50 Hz, embora possa operar na faixa de 105 a 280 V. O sistema pode ser alimentado por um gerador e apoiado por um UPS. Mas também é possível uma versão especial com suporte para 48 V DC.
O subsistema de rede pode ser representado por comutadores ToR de largura dupla (para ambas as colunas) e simples. Há também opções de refrigeração líquida. Até o InfiniBand está disponível – Mellanox possui switches no formato certo para aplicações industriais. Um switch de 1 GbE também é fornecido para a implantação de uma rede de utilitários.
A parte mais interessante é a refrigeração. Assim como na versão “grande” da plataforma, aqui é utilizado um LSS proprietário, que abrange todos os componentes do servidor, para que a parte computacional não necessite de refrigeração ativa a ar e seja capaz de funcionar mesmo com as tampas de contêineres fechadas. A proteção para qualquer classe de IP não é fornecida na versão padrão, mas, novamente, a execução especial é possível mediante solicitação.
O LSS ainda suporta resfriamento com água quente e em todos os componentes a temperatura não excede +45 °C. Para iniciar o módulo de computação, é necessário que esteja em uma sala com temperatura positiva e que não haja condensação. Mas o circuito de resfriamento externo é menos caprichoso e é capaz de operar em temperaturas de -65 ° C. O limite superior não é inferior a +40 °C. Tem os mesmos requisitos de energia que os servidores.
O nó de controle monitora e regula automaticamente os parâmetros de todos os componentes do sistema durante a inicialização e operação. Por padrão, o script de proteção de hardware é usado, portanto, em condições adversas, os servidores podem ser desligados. Mas outros cenários também são possíveis, por exemplo, “trabalho até o fim”, quando a perda de dados é mais cara do que a perda de equipamentos.
A plataforma móvel é controlada pelo sistema de orquestração proprietário “RSK BasIS”, que permite usar todos os recursos de uma infraestrutura definida por software composta, inclusive para a implementação da plataforma HCI. A RSK BasIS oferece GUI, CLI, APIs abertas e SDKs para integração com outros aplicativos. Assim, o cliente recebe uma solução de software e hardware totalmente integrada, pronta para rápida implantação e uso.
Inicialmente, a plataforma foi criada para as necessidades do setor mineiro, mas as suas capacidades não se limitam a esta área. Também é adequado para expedições científicas e empresas industriais (processamento urgente de grandes conjuntos de dados), mídia e eventos públicos (renderização, streaming de várias câmeras), etc. Em geral, sempre que uma plataforma de computação realmente poderosa, mas compacta e fácil de fornecer, implantar e operar é necessária por um tempo.