Singularidade planetária: a infraestrutura de IA da Microsoft inclui mais de 100.000 GPUs, FPGAs e ASICs

A Microsoft divulgou detalhes de seu uso de seu serviço de agendamento distribuído de “escala planetária” Singularity, projetado para gerenciar cargas de trabalho de IA. Em um relatório da empresa, o objetivo da Singularity é ajudar a gigante do software a controlar os custos, garantindo alta utilização de hardware para tarefas de aprendizado profundo.

A Singularity consegue isso com um novo escalonador capaz de alta utilização de aceleradores (incluindo FPGAs e ASICs) sem aumentar os erros ou a degradação do desempenho. A Singularity oferece provisionamento transparente e dimensionamento elástico de recursos de computação alocados para cada tarefa. Na verdade, ele desempenha o papel de uma espécie de camada “inteligente” entre o próprio hardware e a plataforma de software para cargas de trabalho de IA.

Imagem: Microsoft

A singularidade permite separar as tarefas atribuídas aos recursos dos aceleradores. Se o dimensionamento for necessário, o sistema não apenas altera o número de dispositivos envolvidos, mas também gerencia a alocação e a alocação de memória, o que é extremamente importante para cargas de trabalho de IA. O planejamento adequado permite que você não fique ocioso sem a necessidade de um hardware muito caro, devido ao qual um efeito econômico positivo é alcançado.

NVIDIA DGX-2

O relatório também afirma explicitamente que a Microsoft possui centenas de milhares de GPUs e outros aceleradores de IA. Em particular, é mencionado que Singularity é usado em plataformas NVIDIA DGX-2: dois Xeon Platinum 8168 (20 núcleos cada), oito aceleradores V100 com NVSwitch, 692 GB de RAM e uma interconexão InfiniBand. Assim, o parque de IA de uma empresa deve incluir dezenas de milhares de nós, por isso sua gestão eficaz é muito importante.

avalanche

Postagens recentes

A Qualcomm espera faturar US$ 15 bilhões por ano com a venda de chips para servidores até 2029.

O relatório trimestral da Qualcomm veio acompanhado do anúncio dos processadores de servidor Dragonfly C1000,…

21 minutos atrás

Uma versão reforçada do cão robô chinês Lynx M20S escalou encostas de montanhas em temperaturas de -30 graus.

A empresa chinesa DEEP Robotics demonstrou a incrível resistência e capacidade de transposição de terrenos…

6 horas atrás

O aclamado simulador de sobrevivência DayZ ganhará uma sequência – a Bohemia Interactive anunciou oficialmente DayZ 2.

Os desenvolvedores do estúdio tcheco Bohemia Interactive confirmaram o desenvolvimento de uma sequência para o…

8 horas atrás

Em busca de férmions de Majorana: cientistas questionam novamente a tecnologia de computação quântica da Microsoft.

Uma nova crítica publicada na revista científica Nature levanta questões sobre o avanço da computação…

8 horas atrás

A Zoox atualizou seu serviço de robotáxis, com o lançamento do transporte público pago previsto para o final do ano.

A Zoox, empresa pertencente à Amazon, atualizou o design de seu robotáxi especializado. A Zoox…

10 horas atrás

Warhammer 40.000: Rogue Trader atingiu um novo pico de vendas e chegará ao formato físico pela primeira vez.

Após o fracasso do Owlcat Launcher, a Owlcat Games anunciou o sucesso de seu jogo…

11 horas atrás