A Microsoft inaugurou o segundo data center Fairwater AI em Atlanta, Geórgia, conectando-o ao primeiro data center Fairwater AI em Wisconsin para criar um supercluster de computação. Os data centers estão conectados por meio de uma rede dedicada de fibra óptica, a AI Wide Area Network (AI WAN), projetada especificamente para cargas de trabalho de IA. O tamanho e a capacidade do novo data center ainda não foram divulgados, mas serão os maiores já construídos pela Microsoft e possivelmente os maiores do mundo.

O data center utiliza um sistema de resfriamento líquido de circuito fechado, suportado por um dos maiores sistemas de chiller do mundo. A instalação suporta racks com capacidade de aproximadamente 140 kW (1.360 kW por linha). No total, utiliza centenas de milhares dos mais recentes aceleradores de IA NVIDIA GB200/GB300 NVL72, interconectados por uma rede 800 GbE de duas camadas com switches controlados por SONiC. O data center de Atlanta possui dois andares para reduzir a distância entre os racks em todas as três dimensões.

Fonte da imagem: Microsoft

Para a AI WAN, a empresa, em colaboração com a OpenAI, a NVIDIA e outros parceiros, desenvolveu e implementou o protocolo Multi-Path Reliable Connected (MRC) para otimizar a comunicação entre múltiplos data centers de classe Fairwater durante o treinamento de modelos ultragrandes que não cabem em um único data center. O comprimento total dos links da AI WAN ultrapassa 193.000 km.

Fonte da imagem: Microsoft

A Microsoft observou que a rede elétrica confiável de Atlanta permitiu eliminar a necessidade de projetos de geração de energia no local, sistemas UPS dedicados e duas linhas de energia, reduzindo o tempo de inicialização do data center e os custos operacionais. A empresa afirma ter alcançado 99,99% de disponibilidade a um custo de 99,9%.

Fonte da imagem: Microsoft

Foram desenvolvidas soluções exclusivas de software e hardware para gerenciamento de energia, visando suavizar as flutuações de carga da rede causadas por operações de IA. Essas soluções incluem a implementação de tarefas auxiliares durante períodos ociosos, a autolimitação do consumo de energia da GPU e o uso de armazenamento de energia local.

Fonte da imagem: Microsoft

A Microsoft está encomendando cada vez mais data centers em Fairwater e pretende conectá-los em uma rede, transformando-os em um supercomputador virtual distribuído capaz de resolver problemas de maneiras que instalações individuais não conseguem. Segundo a empresa, enquanto um data center tradicional é projetado para executar milhões de aplicativos para vários clientes, a “superfábrica de IA” executa uma única tarefa complexa em milhões de aceleradores.

Os investimentos da Microsoft em data centers e aceleradores estão crescendo rapidamente. Enquanto isso, os principais executivos da Microsoft admitem que “ninguém realmente quer um data center no quintal de casa”. Moradores da maioria das regiões temem o aumento dos custos de energia, danos ambientais e outras preocupações.

Se você notar um erro, selecione-o com o mouse e pressione CTRL+ENTER. | Você consegue escrever um melhor? Ficaremos felizes em receber sua contribuição.

Fonte:

By admin

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *