A Microsoft inaugurou o segundo data center Fairwater AI em Atlanta, Geórgia, conectando-o ao primeiro data center Fairwater AI em Wisconsin para criar um supercluster de computação. Os data centers estão conectados por meio de uma rede dedicada de fibra óptica, a AI Wide Area Network (AI WAN), projetada especificamente para cargas de trabalho de IA. O tamanho e a capacidade do novo data center ainda não foram divulgados, mas serão os maiores já construídos pela Microsoft e possivelmente os maiores do mundo.
O data center utiliza um sistema de resfriamento líquido de circuito fechado, suportado por um dos maiores sistemas de chiller do mundo. A instalação suporta racks com capacidade de aproximadamente 140 kW (1.360 kW por linha). No total, utiliza centenas de milhares dos mais recentes aceleradores de IA NVIDIA GB200/GB300 NVL72, interconectados por uma rede 800 GbE de duas camadas com switches controlados por SONiC. O data center de Atlanta possui dois andares para reduzir a distância entre os racks em todas as três dimensões.
Fonte da imagem: Microsoft
Para a AI WAN, a empresa, em colaboração com a OpenAI, a NVIDIA e outros parceiros, desenvolveu e implementou o protocolo Multi-Path Reliable Connected (MRC) para otimizar a comunicação entre múltiplos data centers de classe Fairwater durante o treinamento de modelos ultragrandes que não cabem em um único data center. O comprimento total dos links da AI WAN ultrapassa 193.000 km.
Fonte da imagem: Microsoft
A Microsoft observou que a rede elétrica confiável de Atlanta permitiu eliminar a necessidade de projetos de geração de energia no local, sistemas UPS dedicados e duas linhas de energia, reduzindo o tempo de inicialização do data center e os custos operacionais. A empresa afirma ter alcançado 99,99% de disponibilidade a um custo de 99,9%.
Fonte da imagem: Microsoft
Foram desenvolvidas soluções exclusivas de software e hardware para gerenciamento de energia, visando suavizar as flutuações de carga da rede causadas por operações de IA. Essas soluções incluem a implementação de tarefas auxiliares durante períodos ociosos, a autolimitação do consumo de energia da GPU e o uso de armazenamento de energia local.
Fonte da imagem: Microsoft
A Microsoft está encomendando cada vez mais data centers em Fairwater e pretende conectá-los em uma rede, transformando-os em um supercomputador virtual distribuído capaz de resolver problemas de maneiras que instalações individuais não conseguem. Segundo a empresa, enquanto um data center tradicional é projetado para executar milhões de aplicativos para vários clientes, a “superfábrica de IA” executa uma única tarefa complexa em milhões de aceleradores.
Os investimentos da Microsoft em data centers e aceleradores estão crescendo rapidamente. Enquanto isso, os principais executivos da Microsoft admitem que “ninguém realmente quer um data center no quintal de casa”. Moradores da maioria das regiões temem o aumento dos custos de energia, danos ambientais e outras preocupações.
Se você notar um erro, selecione-o com o mouse e pressione CTRL+ENTER. | Você consegue escrever um melhor? Ficaremos felizes em receber sua contribuição.
Fonte:
É difícil contestar o fato de que, entre os fabricantes de hardware, a Nvidia é…
A Curator, empresa especializada em disponibilidade de internet e mitigação de DDoS, mitigou um ataque…
A curta trajetória da Xiaomi como fabricante de veículos elétricos não lhe permite ostentar uma…
O fundador do Facebook, Mark Zuckerberg, pode ser considerado uma pessoa apaixonada, visto que as…
Após relatos de que uma atualização do Windows 11 lançada em março estava bloqueando o…
Os fãs de Dragon's Dogma 2, o RPG de ação e fantasia em mundo aberto…