Supercomputador AI para ricos: agora no Google Cloud você pode obter imediatamente 26 mil aceleradores NVIDIA H100

O Google Cloud revelou as instâncias A3 do Google Compute Engine na Google I/O Developer Conference, criadas especificamente para maximizar o desempenho das cargas de trabalho de aprendizado de máquina. Novos itens usam CPUs modernas, memória rápida, aceleradores NVIDIA e IPUs Intel.

A máquina virtual A3 inclui:

  • 8 funis NVIDIA H100.
  • Switches NVIDIA NVSwitch com NVLink 4.0 fornecendo largura de banda de 3,6 TB/s entre os aceleradores.
  • Processadores Intel Xeon Sapphire Rapids.
  • RAM DDR5-4800 de 2 TB.
  • IPU de 200 Gb/s, pilha dedicada de comunicação entre servidores GPU↔GPU e otimizações NCCL.

Além de usar os Mount Evans DPU/IPUs desenvolvidos em conjunto com a Intel, os clusters A3 também utilizam os switches ópticos reconfiguráveis ​​sob demanda do Google Jupiter que a empresa já usa em seus próprios clusters de aceleradores de IA. Tudo isso permite combinar até 26 mil aceleradores H100 em um supercomputador AI em nuvem com desempenho de até 26 Eflops.

Imagem: Google

A principal diferença de outras ofertas de nuvem está na interconexão e escalabilidade. Por exemplo, supercomputadores de IA no Microsoft Azure combinam milhares e até dezenas de milhares de aceleradores usando InfiniBand e NVIDIA DPUs. O Oracle Cloud Infrastructure (OCI), que anteriormente detinha um recorde de 32.768 pools de aceleradores, usa a mesma abordagem. Finalmente, até 20.000 aceleradores podem ser combinados na AWS graças ao EFA.

O Google oferecerá aos clientes várias opções para usar o A3: os clientes poderão executar a VM por conta própria ou como um serviço gerenciado, onde o Google cuidará da maior parte do trabalho. É possível usar A3 no Google Kubernetes Engine (GKE) ou no Vertex AI. Atualmente, as VMs A3 estão disponíveis apenas após o registro na lista de espera de visualização. Agora, a empresa está ocupada implantando vários clusters A3 nas maiores regiões de nuvem.

avalanche

Postagens recentes

Meta mentiu sobre a segurança do Facebook, Instagram e WhatsApp para crianças; tribunal a multou em US$ 375 milhões.

Um júri do Novo México considerou a Meta culpada de violar a lei estadual em…

18 minutos atrás

A escassez de processadores para PC está se agravando, com preços em alta e prazos de entrega já estendidos por meses.

Os preços da memória começaram a subir para os consumidores no segundo semestre do ano…

41 minutos atrás

Foi anunciado o Arbiter 131, um jogo de estratégia tática não linear onde “tudo é decidido através da jogabilidade”.

Os desenvolvedores da Ikon Studios, por meio do portal IGN, apresentaram Arbiter 131 – um…

2 horas atrás

A Arm espera aumentar sua receita em seis vezes em cinco anos, com as vendas de seus próprios chips de IA gerando até US$ 15 bilhões por ano.

Enquanto a Intel vem tentando conquistar a confiança de seus concorrentes nos últimos anos, oferecendo-lhes…

2 horas atrás

Para motivar os principais executivos, a Meta oferecerá a eles opções de recompra de ações pela primeira vez desde seu IPO.

No ano passado, a Meta✴Platforms estabeleceu um alto padrão de remuneração para seus principais especialistas…

3 horas atrás

A SK Hynix planeja abrir seu capital na bolsa de valores dos EUA ainda este ano.

Embora alguns especialistas apontem para condições desfavoráveis ​​para ofertas públicas iniciais (IPOs), empresas com necessidades…

4 horas atrás