Singularidade planetária: a infraestrutura de IA da Microsoft inclui mais de 100.000 GPUs, FPGAs e ASICs

A Microsoft divulgou detalhes de seu uso de seu serviço de agendamento distribuído de “escala planetária” Singularity, projetado para gerenciar cargas de trabalho de IA. Em um relatório da empresa, o objetivo da Singularity é ajudar a gigante do software a controlar os custos, garantindo alta utilização de hardware para tarefas de aprendizado profundo.

A Singularity consegue isso com um novo escalonador capaz de alta utilização de aceleradores (incluindo FPGAs e ASICs) sem aumentar os erros ou a degradação do desempenho. A Singularity oferece provisionamento transparente e dimensionamento elástico de recursos de computação alocados para cada tarefa. Na verdade, ele desempenha o papel de uma espécie de camada “inteligente” entre o próprio hardware e a plataforma de software para cargas de trabalho de IA.

Imagem: Microsoft

A singularidade permite separar as tarefas atribuídas aos recursos dos aceleradores. Se o dimensionamento for necessário, o sistema não apenas altera o número de dispositivos envolvidos, mas também gerencia a alocação e a alocação de memória, o que é extremamente importante para cargas de trabalho de IA. O planejamento adequado permite que você não fique ocioso sem a necessidade de um hardware muito caro, devido ao qual um efeito econômico positivo é alcançado.

NVIDIA DGX-2

O relatório também afirma explicitamente que a Microsoft possui centenas de milhares de GPUs e outros aceleradores de IA. Em particular, é mencionado que Singularity é usado em plataformas NVIDIA DGX-2: dois Xeon Platinum 8168 (20 núcleos cada), oito aceleradores V100 com NVSwitch, 692 GB de RAM e uma interconexão InfiniBand. Assim, o parque de IA de uma empresa deve incluir dezenas de milhares de nós, por isso sua gestão eficaz é muito importante.

avalanche

Postagens recentes

A AMD trouxe de volta uma lenda: o Ryzen 7 5800X3D foi relançado em uma versão comemorativa do 10º aniversário do AM4.

Na Computex 2026, a AMD apresentou o processador Ryzen 7 5800X3D 10th Anniversary Edition, celebrando…

3 horas atrás

A AMD lançará mundialmente a Radeon RX 9070 GRE – uma placa de vídeo de 12 GB para jogos confortáveis ​​em 1440p, com preço de US$ 549.

Além do anúncio dos novos processadores, a AMD anunciou o lançamento global da placa de…

3 horas atrás

A AMD estendeu a vida útil do AM5 até 2029 e lançou o chip X3D mais acessível para a plataforma – o Ryzen 7 7700X3D.

Na Computex 2026, a AMD anunciou o processador Ryzen 7 7700X3D, que deverá ser o…

3 horas atrás

SMERSH: Wolf Hunter, o sucessor espiritual dos jogos de furtividade Death to Spies, foi anunciado.

A desenvolvedora Haggard Games (da série "Death to Spies") anunciou "SMERSH: Wolf Hunter", um jogo…

7 horas atrás

A MSI apresenta um monitor 5K de 180Hz com retroiluminação Mini LED.

A MSI apresentou o MPG 271KRAW18, o primeiro monitor gamer Mini LED 5K do mundo…

7 horas atrás

Hackers iranianos transformaram o ChatGPT e o Gemini em armas de guerra cibernética.

Enquanto políticos de todo o mundo tentam resolver a situação no Oriente Médio, a unidade…

10 horas atrás