Categorias: Processadores

A Microsoft lançou o segundo centro de dados de IA “mais avançado” do mundo, o projeto Fairwater, como parte de seu esforço para criar uma superfábrica de IA.

A Microsoft inaugurou o segundo data center Fairwater AI em Atlanta, Geórgia, conectando-o ao primeiro data center Fairwater AI em Wisconsin para criar um supercluster de computação. Os data centers estão conectados por meio de uma rede dedicada de fibra óptica, a AI Wide Area Network (AI WAN), projetada especificamente para cargas de trabalho de IA. O tamanho e a capacidade do novo data center ainda não foram divulgados, mas serão os maiores já construídos pela Microsoft e possivelmente os maiores do mundo.

O data center utiliza um sistema de resfriamento líquido de circuito fechado, suportado por um dos maiores sistemas de chiller do mundo. A instalação suporta racks com capacidade de aproximadamente 140 kW (1.360 kW por linha). No total, utiliza centenas de milhares dos mais recentes aceleradores de IA NVIDIA GB200/GB300 NVL72, interconectados por uma rede 800 GbE de duas camadas com switches controlados por SONiC. O data center de Atlanta possui dois andares para reduzir a distância entre os racks em todas as três dimensões.

Fonte da imagem: Microsoft

Para a AI WAN, a empresa, em colaboração com a OpenAI, a NVIDIA e outros parceiros, desenvolveu e implementou o protocolo Multi-Path Reliable Connected (MRC) para otimizar a comunicação entre múltiplos data centers de classe Fairwater durante o treinamento de modelos ultragrandes que não cabem em um único data center. O comprimento total dos links da AI WAN ultrapassa 193.000 km.

Fonte da imagem: Microsoft

A Microsoft observou que a rede elétrica confiável de Atlanta permitiu eliminar a necessidade de projetos de geração de energia no local, sistemas UPS dedicados e duas linhas de energia, reduzindo o tempo de inicialização do data center e os custos operacionais. A empresa afirma ter alcançado 99,99% de disponibilidade a um custo de 99,9%.

Fonte da imagem: Microsoft

Foram desenvolvidas soluções exclusivas de software e hardware para gerenciamento de energia, visando suavizar as flutuações de carga da rede causadas por operações de IA. Essas soluções incluem a implementação de tarefas auxiliares durante períodos ociosos, a autolimitação do consumo de energia da GPU e o uso de armazenamento de energia local.

Fonte da imagem: Microsoft

A Microsoft está encomendando cada vez mais data centers em Fairwater e pretende conectá-los em uma rede, transformando-os em um supercomputador virtual distribuído capaz de resolver problemas de maneiras que instalações individuais não conseguem. Segundo a empresa, enquanto um data center tradicional é projetado para executar milhões de aplicativos para vários clientes, a “superfábrica de IA” executa uma única tarefa complexa em milhões de aceleradores.

Os investimentos da Microsoft em data centers e aceleradores estão crescendo rapidamente. Enquanto isso, os principais executivos da Microsoft admitem que “ninguém realmente quer um data center no quintal de casa”. Moradores da maioria das regiões temem o aumento dos custos de energia, danos ambientais e outras preocupações.

Se você notar um erro, selecione-o com o mouse e pressione CTRL+ENTER. | Você consegue escrever um melhor? Ficaremos felizes em receber sua contribuição.

Fonte:

admin

Postagens recentes

Não é só Fallout 3: Informante dá dicas sobre remasterização de Fallout: New Vegas (3DNews)

O tão aguardado remaster de Fallout 3 não parece ser o último da aclamada série…

13 minutos atrás

A NVIDIA planeja produzir todos os seus sistemas de IA internamente, relegando a Foxconn e outros parceiros a um segundo plano.

A NVIDIA está se preparando para mudar seu modelo de negócios atual para servidores de…

55 minutos atrás

Os principais clientes da Nexperia, que teve seus chips apreendidos, encontraram uma maneira engenhosa de obtê-los.

Os problemas criados pelo conflito sino-holandês em torno da Nexperia resultaram na incapacidade da empresa…

1 hora atrás

“O Kvatch que merecemos”: Artista impressiona fãs com uma versão realista da cidade de The Elder Scrolls IV: Oblivion – 3DNews

O artista 3D australiano Leo Torres continua a reimaginar locais icônicos de Tamriel dos jogos…

1 hora atrás

Além da exaescala: a Eviden revela a plataforma de supercomputador BullSequana XH3500.

A Eviden, empresa do Grupo Atos, anunciou a plataforma de supercomputador convergente BullSequana XH3500 para…

1 hora atrás