A Schneider Electric fez uma declaração importante: o equipamento para um trabalho eficaz com sistemas de IA revelou-se tão intensivo em recursos que os operadores e construtores de centros de dados podem ter de reconsiderar os princípios de criação e modernização de tais instalações. A empresa ainda observou em seu estudo que, em princípio, é improvável que alguns data centers existentes sejam atualizados.

O fato é que os sistemas de IA geralmente exigem uma infraestrutura de rede com baixa latência para transferência de dados em grandes volumes e “densificação” de racks, para os quais as características da infraestrutura dos data centers atuais simplesmente não estão preparadas. Em condições em que um acelerador moderno pode consumir mais de 700 W e os sistemas de servidores excederam 10 kW, a capacidade dos data centers modernos claramente não é suficiente, porque para treinar modelos modernos de grandes linguagens (LLMs) em um tempo razoável, você não precisa um ou dois aceleradores, mas dezenas ou centenas de racks.

Foto: Anthony Indraus/Unsplash

A Schneider Electric afirma que a maioria dos data centers tem um limite de 10 a 20 kW por rack e, para trabalhar com LLM, é extremamente benéfico agrupar o máximo de equipamentos possível em um rack para reduzir a latência, evitar congestionamentos na rede e geralmente gastar menos em interconexão. . É exatamente por isso que a NVIDIA, por exemplo, está desenvolvendo o NVLink. Embora tal solução dificilmente possa ser chamada de barata, em termos de TCO ela pode, na verdade, revelar-se mais lucrativa. No entanto, a situação da inferência não é tão triste, uma vez que são necessários muito menos recursos.

Fonte: Schneider Electric

De uma forma ou de outra, surge a questão sobre o aumento do fornecimento de energia aos racks (mais de 20 kW) e a remoção efetiva de calor dessa energia. Os problemas são solucionáveis, mas os operadores terão de alterar a infra-estrutura física. Por exemplo, é necessária uma transição de 120/208 V para 240/415 V, o que reduzirá o número de circuitos. No entanto, a própria Schneider Electric enfatiza que mesmo PDUs modernas e poderosas são pouco adequadas para tais cargas – elas precisam ser colocadas várias em um rack ou mesmo encomendadas. Além disso, você terá que cuidar da proteção contra descargas de arco.

Fonte: Schneider Electric

Quanto à refrigeração, a Schneider Electric estabeleceu um limite de 20 kW/rack, acima do qual é impossível evitar o LCS. A empresa está inclinada a sistemas de refrigeração líquida direta com blocos de água para componentes quentes, mas tem uma atitude fria em relação a sistemas submersíveis de refrigeração líquida, especialmente sistemas de refrigeração líquida bifásicos. A razão reside na utilização de produtos químicos PFAS neles, que poderiam ser proibidos na União Europeia. Em qualquer caso, recomenda-se considerar cuidadosamente a escolha dos sistemas de suporte à vida devido à virtual ausência de padrões uniformes.

Fonte: Schneider Electric

Se as características dos edifícios ainda permitem a modernização (e nem sempre é o caso), recomenda-se a utilização de racks mais largos com altura de 48U (sem esquecer a altura das aberturas e portões) com profundidade de instalação do equipamento de pelo menos 40 ″, capaz de suportar uma carga estática de pelo menos 1,8 t. Por fim, a Schneider Electric aconselha a utilização de uma ampla gama de software especializado para gerenciar a infraestrutura do data center, fornecimento de energia e outros aspectos da operação – esse software pode identificar possíveis problemas antes que eles têm um impacto crítico nos processos de trabalho críticos para os negócios.

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *