SC20: NVIDIA anuncia InfiniBand NDR: adaptadores de 400 Gbps precisam de PCIe 5.0

Junto com os aceleradores A100 atualizados e produtos baseados nele, a NVIDIA anunciou soluções baseadas no padrão InfiniBand NDR, que, como deveria ser, dobra a largura de banda de uma linha para 100 Gbps. Os novos adaptadores e DPUs da NVIDIA terão portas e switches de 400 Gbps – 64 portas de 400 Gbps ou 128 portas de 200 Gbps, capazes de lidar com 66,5 bilhões de pacotes por segundo. Os switches modulares permitirão que você obtenha até 2048 portas com uma largura de banda total de 1,64 Pbit / s.

Além disso, a escalabilidade da rede foi aprimorada, que é capaz de conectar mais de um milhão de GPUs com apenas três saltos entre qualquer uma delas. E com o aumento do número de nós, tanto o custo de propriedade quanto o consumo de energia diminuem, o que será importante para os supercomputadores da classe exafplus. A empresa observa separadamente que o InfiniBand NDR conseguiu manter a capacidade de usar cabos de cobre passivos em distâncias curtas (até 1,5 m).

Além de aumentar a taxa de transferência, o desempenho do MPI foi quadruplicado, pelo qual mecanismos de hardware separados são responsáveis. E os aplicativos de IA podem obter aceleração adicional graças à tecnologia Mellanox SHARP (Scalable Hierarchical Aggregation and Reduction Protocol). DPUs, devido à presença de núcleos de uso geral, podem assumir parte do processamento de dados e, ao longo do caminho, ser responsáveis ​​pela segurança, isolamento, monitoramento e gerenciamento de infraestrutura. Geralmente, a NVIDIA está falando sobre uma CPU distribuída “viva” na rede, que complementa efetivamente os aceleradores da empresa.

No entanto, o InfiniBand NDR, como o padrão concorrente de 400GbE, tem uma desvantagem. Novos adaptadores requerem 16 pistas PCIe 5.0 ou 32 pistas PCIe 4.0. O PCIe 5.0 não estará disponível em breve, e as linhas PCIe 4.0 em sistemas modernos estão sedentos não apenas por adaptadores, mas também pelos próprios drives e aceleradores. O uso de switches PCIe pode reduzir a eficiência da troca de dados, então provavelmente a coisa mais interessante seria ver DPUs com complexos de raiz, mas maiores. Os primeiros produtos baseados na nova norma devem aparecer no segundo trimestre de 2021.

avalanche

Postagens recentes

Garmin revela o Fenix ​​​​8 Pro Smartwatch com suporte para celular e satélite, mas há um porém

A Garmin anunciou hoje a linha Fenix ​​8 Pro de relógios inteligentes, que suportam comunicações…

16 minutos atrás

Acer apresenta o primeiro laptop Intel Panther Lake — Swift 16 AI com touchpad gigante

A Acer anunciou uma versão do notebook Swift 16 AI baseado nos futuros processadores Panther…

16 minutos atrás

Ações do Google disparam após empresa evitar venda forçada do Chrome

As ações da Alphabet, controladora do Google, subiram cerca de 8% hoje, após o tribunal…

33 minutos atrás

TSMC nega rumores de que Jensen Huang tentou pressioná-la em nome de Trump

Há duas semanas, o CEO da Nvidia, Jensen Huang, voou inesperadamente para Taiwan e passou…

2 horas atrás