SC20: NVIDIA anuncia InfiniBand NDR: adaptadores de 400 Gbps precisam de PCIe 5.0

Junto com os aceleradores A100 atualizados e produtos baseados nele, a NVIDIA anunciou soluções baseadas no padrão InfiniBand NDR, que, como deveria ser, dobra a largura de banda de uma linha para 100 Gbps. Os novos adaptadores e DPUs da NVIDIA terão portas e switches de 400 Gbps – 64 portas de 400 Gbps ou 128 portas de 200 Gbps, capazes de lidar com 66,5 bilhões de pacotes por segundo. Os switches modulares permitirão que você obtenha até 2048 portas com uma largura de banda total de 1,64 Pbit / s.

Além disso, a escalabilidade da rede foi aprimorada, que é capaz de conectar mais de um milhão de GPUs com apenas três saltos entre qualquer uma delas. E com o aumento do número de nós, tanto o custo de propriedade quanto o consumo de energia diminuem, o que será importante para os supercomputadores da classe exafplus. A empresa observa separadamente que o InfiniBand NDR conseguiu manter a capacidade de usar cabos de cobre passivos em distâncias curtas (até 1,5 m).

Além de aumentar a taxa de transferência, o desempenho do MPI foi quadruplicado, pelo qual mecanismos de hardware separados são responsáveis. E os aplicativos de IA podem obter aceleração adicional graças à tecnologia Mellanox SHARP (Scalable Hierarchical Aggregation and Reduction Protocol). DPUs, devido à presença de núcleos de uso geral, podem assumir parte do processamento de dados e, ao longo do caminho, ser responsáveis ​​pela segurança, isolamento, monitoramento e gerenciamento de infraestrutura. Geralmente, a NVIDIA está falando sobre uma CPU distribuída “viva” na rede, que complementa efetivamente os aceleradores da empresa.

No entanto, o InfiniBand NDR, como o padrão concorrente de 400GbE, tem uma desvantagem. Novos adaptadores requerem 16 pistas PCIe 5.0 ou 32 pistas PCIe 4.0. O PCIe 5.0 não estará disponível em breve, e as linhas PCIe 4.0 em sistemas modernos estão sedentos não apenas por adaptadores, mas também pelos próprios drives e aceleradores. O uso de switches PCIe pode reduzir a eficiência da troca de dados, então provavelmente a coisa mais interessante seria ver DPUs com complexos de raiz, mas maiores. Os primeiros produtos baseados na nova norma devem aparecer no segundo trimestre de 2021.

avalanche

Postagens recentes

A Siri, com sua inteligência artificial, sugerirá pausas em conversas prolongadas e lembrará que ela não é humana.

Foram descobertas referências no código do iOS 27 da Apple indicando que a assistente virtual…

49 minutos atrás

A BYD vai investir €2 bilhões em sua rede de carregamento na Europa e no Reino Unido.

A BYD planeja investir € 2 bilhões na construção de uma rede de estações de…

1 hora atrás

Mercado de smartphones em declínio: a Samsung está se saindo melhor do que qualquer outra empresa na crise de memória.

Segundo analistas da TrendForce, 284 milhões de smartphones foram produzidos mundialmente no primeiro trimestre, representando…

2 horas atrás

Astrônomos determinaram, pela primeira vez, os limites do berço estelar da Via Láctea.

Até recentemente, a extensão da região ativa de formação estelar em nossa galáxia, a Via…

2 horas atrás

A Apple afirmou que tem o direito de remover da App Store aplicativos que não atraem usuários.

A Apple alertou os desenvolvedores de que nem todos os seus aplicativos poderão permanecer na…

2 horas atrás