A NVIDIA anunciou seus aceleradores Rubin AI de próxima geração, que substituirão o Blackwell Ultra no segundo semestre de 2026. O lançamento do Rubin Ultra está previsto para o segundo semestre de 2027. Eles serão acompanhados pelos processadores Arm Vera. A série recebeu o nome da astrônoma Vera Florence Cooper Rubin, conhecida por sua pesquisa sobre matéria escura.

A NVIDIA observou que havia um “erro de impressão” no nome dos aceleradores anteriores. Em Blackwell, cada chip consiste em duas GPUs, mas, por exemplo, o nome GB200/GB300 NVL72 menciona apenas 72 GPUs, embora na verdade se refira a 144 GPUs. Portanto, começando com Rubin, a empresa usará um novo esquema de nomenclatura que não leva mais em consideração o número de chips, mas se refere exclusivamente ao número de GPUs. Assim, a próxima geração de superaceleradores, embalados no mesmo rack Oberon usado por Grace Blackwell, foi chamada de Vera Rubin NVL144.

Rubin segue em grande parte o design de Blackwell, já que o R200 ainda inclui dois chips de GPU (em SXM7) capazes de fornecer até 50 Pflops em cálculos FP4 (sem escassez) e 288 GB de memória em oito pilhas de 12-Hi, mas desta vez é HBM4 com uma largura de banda total de 13 TB/s (barramento de 2048 bits). Os cristais da GPU serão fabricados usando a tecnologia de processo TSMC N3P e serão acompanhados por dois chiplets de E/S responsáveis ​​por todas as comunicações externas, escreve a SemiAnalysis. Tudo junto será empacotado usando CoWoS-L. O TDP dos novos produtos não é especificado.

Fonte da imagem: NVIDIA

Os chips serão movidos para a interconexão NVLink 6 com uma velocidade de 1,8 TB/s em cada direção (3,6 TB/s em duplex), o que é duas vezes mais rápido que a geração atual do NVLink 5. A capacidade de comutação do NVSwitch, assim como do NVLink C2C, aumentará de forma semelhante. Entretanto, se o esquema anterior for mantido, onde uma CPU atende dois módulos de GPU, cada um destes últimos aparentemente receberá metade da largura de banda do barramento. O processador Vera em si receberá 88 núcleos Arm de 3 nm personalizados (não Neoverse CSS no caso do Grace), com SMT, o que dará 176 threads. Cada CPU receberá cerca de 1 TB de memória LPDRR e será duas vezes mais rápida que a Grace, com um pacote térmico de cerca de 50 W.

De acordo com a NVIDIA, o VR200 NVL144 será 3,3 vezes mais rápido: 3,6 EFLOPS na inferência FP4 e 1,2 EFLOPS no treinamento FP8. O volume total de memória HBM será de mais de 20,7 TB, memória do sistema – 75 TB. A rede externa será representada por adaptadores ConnectX-9 SuperNIC com uma velocidade de 1,6 Tbps por porta, o que é duas vezes mais rápido que o ConnectX-8 que atende ao GB300.

No segundo semestre de 2027, o acelerador Rubin Ultra (R300) aparecerá com desempenho FP4 de mais de 100 Pflops (sem escassez), combinando quatro GPUs, dois chiplets IO e 16 pilhas de memória 16-Hi HBM4e com uma capacidade total de 1 TB (32 TB/s) em um pacote SXM8. Além disso, os aceleradores aparentemente também receberão memória LPDDR. O processador Vera migrará para a nova plataforma sem alterações, com uma CPU para quatro GPUs. O barramento interno será o NVLink 7, que manterá a velocidade do NVLink 6, mas receberá um switch NVSwitch quatro vezes mais produtivo. No entanto, as conexões externas ainda serão gerenciadas pelos adaptadores ConnectX-9.

O novo rack Kyber mudará completamente o layout. Os nós agora se assemelham aos servidores blade verticais usados ​​em supercomputadores. Cada nó (VR300) incluirá um processador Vera e um acelerador Rubin Ultra. Haverá 144 desses nós no total, o que dá 144 CPUs, 576 GPUs e 144 TB de HBM4e. O superacelerador Rubin Ultra NVL576 consumirá 600 kW e fornecerá desempenho de 15 EFLOPS para inferência (FP4) e 5 EFLOPS para treinamento (FP8). É mencionado que o volume de memória rápida será de 365 TB, mas não foi especificado quanto dele irá para a CPU.

Os planos futuros da NVIDIA incluem o lançamento, no segundo semestre de 2028, do primeiro acelerador baseado na nova arquitetura Feynman, batizada em homenagem ao físico teórico Richard Phillips Feynman. Segundo relatos, Feynman contará com memória HBM de “próxima geração” e provavelmente CPUs Vera. Esta geração também receberá switches NVSwitch 8 (NVL-Next), switches de rede Spectrum7 e adaptadores ConnectX-10.

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *