A NVIDIA, de acordo com o analista Ming-Chi Kuo, decidiu abandonar a produção de sistemas AI NVL36×2 de dois racks baseados em aceleradores GB200 em favor de máquinas NVL72 e NVL36 de rack único. Isto é explicado por recursos limitados e preferências do cliente.
Inicialmente, foi planejado o lançamento de três supersistemas GB200 baseados em aceleradores Blackwell para cargas de trabalho de IA e HPC – NVL72, NVL36 e NVL36×2. O primeiro combina 18 nós 1U em um rack, cada um contendo dois aceleradores GB200. No total, isso dá 72 chips B200 e 36 processadores Grace. O barramento NVLink 5 está habilitado e o consumo de energia do sistema é de 120 kW. Por sua vez, o NVL36 possui 36 chips B200, enquanto o NVL36×2 combina dois desses sistemas.
Esperava-se que a configuração NVL36×2 se tornasse mais difundida que a NVL72. O fato é que os data centers da maioria dos clientes NVIDIA não conseguem atender aos requisitos NVL72 em termos de energia e refrigeração. Deste ponto de vista, o NVL36×2 representa uma solução de compromisso. Por outro lado, o NVL72 requer menos espaço de instalação e tem menor consumo total de energia: cada um dos racks NVL36x2 requer 66 kW, totalizando 132 kW. Isso resulta em um desempenho ligeiramente inferior.
De acordo com Ming-Chi Kuo, alguns clientes, em particular a Microsoft, preferiram o NVL72 ao NVL36x2. Ao mesmo tempo, surgiram divergências entre as empresas quanto à configuração dos racks ainda na fase de discussão. Além disso, gerenciar três projetos diferentes para criar superaceleradores baseados no GB200 tornou-se uma tarefa difícil para a NVIDIA. Portanto, decidiu-se abandonar a máquina de dois postes.
Observa-se também que a produção em massa do NVL72 pode ser adiada até o segundo semestre de 2025, embora o primeiro semestre do próximo ano tenha sido previamente convocado. No entanto, alguns clientes, incluindo a Microsoft, começarão a receber estes sistemas em dezembro.