Huang revelou o Vera Rubin Superchip – uma CPU, duas GPUs enormes e 100 petaflops em uma única placa para IA de última geração.

Na conferência GTC 2025, o CEO da Nvidia, Jensen Huang, demonstrou o processador gráfico de próxima geração da empresa, o Rubin. Mais especificamente, ele revelou um protótipo do acelerador Vera Rubin Superchip, que combina a novíssima CPU Vera e um par de GPUs Rubin de grande porte em uma única placa. Essa combinação promete um novo nível de desempenho para os supercomputadores de IA do futuro.

Fonte da imagem: Nvidia

Cada GPU Rubin consiste em dois chips grandes com núcleos CUDA e oito pilhas de memória HBM4 de alta velocidade com capacidade de 288 GB. As especificações da GPU, bem como a largura de banda da memória, não são especificadas. No entanto, um único sistema Vera Rubin Superchip é capaz de fornecer 100 petaflops (100 quatrilhões de operações por segundo) de desempenho de IA (FP4).

Quanto à CPU Vera, sabe-se que ela oferece 88 núcleos com base em uma versão não especificada da arquitetura ARM com 176 threads e será conectada às GPUs por meio de uma interface NVLink-C2C com largura de banda de 1,8 TB/s. A placa também contará com RAM LPDDR (a versão não foi especificada, mas é bem possível que seja LPDDR6), elevando a capacidade total de RAM por superchip para 2 TB.

A Nvidia oferecerá uma ampla gama de sistemas baseados nos novos aceleradores, como novas Compute Trays, incluindo uma versão CPX para tarefas com grandes contextos de modelos de IA. A empresa também anunciou racks de servidores Vera Rubin NVL144 prontos para uso, com desempenho de 3,6 EFLOPS (3,6 quintilhões de operações por segundo) para execução de modelos de IA pré-treinados (inferência FP4) e 1,2 EFLOPS para modelos de treinamento (treinamento FP8). Isso é aproximadamente 3,3 vezes mais rápido que os atuais sistemas GB300 NVL72. O sistema oferecerá um total de 13 TB de memória HBM4 e 75 TB de memória de sistema rápida, enquanto a largura de banda total das interfaces NVLink e CX9 atingirá 260 TB/s e 28,8 TB/s, respectivamente.

A Nvidia também revelou detalhes do sistema em chip NVL576 baseado nos chips Rubin Ultra, previsto para o segundo semestre de 2027. Esses chips incluirão quatro grandes chips de GPU em um único wafer e 1 TB de memória HBM4e. O sistema NVL576 oferecerá desempenho de até 15 EFLOPS (FP4) e 5 EFLOPS (FP8), oferecendo até 365 TB de memória de sistema rápida e largura de banda de rede de até 1,5 PB/s via NVLink.

A Nvidia anunciou que as primeiras unidades de teste Rubin já chegaram aos laboratórios da empresa para testes, com produção em massa planejada para 2026. Essa arquitetura será substituída pela arquitetura Feynman completamente nova, com lançamento previsto para 2027-2028. No entanto, a Nvidia ainda não apresentou nenhum chip baseado nessa plataforma; é improvável que eles existam em formato físico neste momento.

admin

Compartilhar
Publicado por
admin

Postagens recentes

Com o anúncio do OCuLink Dev Kit, a Framework transforma o Laptop 16 modular em um “quase-desktop”.

A Framework, fabricante de laptops modulares, anunciou novos modelos para o Laptop 16, incluindo uma…

3 horas atrás

Linha de Defesa: Uma Visão Geral de Máquinas Virtuais e Sandboxes para Android

Aplicativos móveis com reputação duvidosa são muito comuns hoje em dia, mesmo de fontes confiáveis.…

3 horas atrás

A era dos Macs da Apple com processadores Intel está chegando ao fim – eles não receberão suporte para o próximo macOS 27.

O MacRumors lembrou que o macOS 26 Tahoe será a última versão principal do sistema…

3 horas atrás

Sai da frente, Logitech: a Framework está preparando um teclado sem fio com touchpad e arquitetura aberta.

A Framework anunciou o desenvolvimento de um novo teclado sem fio com touchpad, que substituirá…

3 horas atrás

A Turbo Cloud lançou uma plataforma para o lançamento rápido de modelos de IA com cobrança por minuto e escalonamento automático.

A provedora de nuvem Turbo Cloud (parte do cluster de TI comercial da Rostelecom) lançou…

4 horas atrás