Na conferência GTC 2025, o CEO da Nvidia, Jensen Huang, demonstrou o processador gráfico de próxima geração da empresa, o Rubin. Mais especificamente, ele revelou um protótipo do acelerador Vera Rubin Superchip, que combina a novíssima CPU Vera e um par de GPUs Rubin de grande porte em uma única placa. Essa combinação promete um novo nível de desempenho para os supercomputadores de IA do futuro.

Fonte da imagem: Nvidia
Cada GPU Rubin consiste em dois chips grandes com núcleos CUDA e oito pilhas de memória HBM4 de alta velocidade com capacidade de 288 GB. As especificações da GPU, bem como a largura de banda da memória, não são especificadas. No entanto, um único sistema Vera Rubin Superchip é capaz de fornecer 100 petaflops (100 quatrilhões de operações por segundo) de desempenho de IA (FP4).
Quanto à CPU Vera, sabe-se que ela oferece 88 núcleos com base em uma versão não especificada da arquitetura ARM com 176 threads e será conectada às GPUs por meio de uma interface NVLink-C2C com largura de banda de 1,8 TB/s. A placa também contará com RAM LPDDR (a versão não foi especificada, mas é bem possível que seja LPDDR6), elevando a capacidade total de RAM por superchip para 2 TB.

A Nvidia oferecerá uma ampla gama de sistemas baseados nos novos aceleradores, como novas Compute Trays, incluindo uma versão CPX para tarefas com grandes contextos de modelos de IA. A empresa também anunciou racks de servidores Vera Rubin NVL144 prontos para uso, com desempenho de 3,6 EFLOPS (3,6 quintilhões de operações por segundo) para execução de modelos de IA pré-treinados (inferência FP4) e 1,2 EFLOPS para modelos de treinamento (treinamento FP8). Isso é aproximadamente 3,3 vezes mais rápido que os atuais sistemas GB300 NVL72. O sistema oferecerá um total de 13 TB de memória HBM4 e 75 TB de memória de sistema rápida, enquanto a largura de banda total das interfaces NVLink e CX9 atingirá 260 TB/s e 28,8 TB/s, respectivamente.

A Nvidia também revelou detalhes do sistema em chip NVL576 baseado nos chips Rubin Ultra, previsto para o segundo semestre de 2027. Esses chips incluirão quatro grandes chips de GPU em um único wafer e 1 TB de memória HBM4e. O sistema NVL576 oferecerá desempenho de até 15 EFLOPS (FP4) e 5 EFLOPS (FP8), oferecendo até 365 TB de memória de sistema rápida e largura de banda de rede de até 1,5 PB/s via NVLink.
A Nvidia anunciou que as primeiras unidades de teste Rubin já chegaram aos laboratórios da empresa para testes, com produção em massa planejada para 2026. Essa arquitetura será substituída pela arquitetura Feynman completamente nova, com lançamento previsto para 2027-2028. No entanto, a Nvidia ainda não apresentou nenhum chip baseado nessa plataforma; é improvável que eles existam em formato físico neste momento.
