Huang revelou o Vera Rubin Superchip – uma CPU, duas GPUs enormes e 100 petaflops em uma única placa para IA de última geração.

Na conferência GTC 2025, o CEO da Nvidia, Jensen Huang, demonstrou o processador gráfico de próxima geração da empresa, o Rubin. Mais especificamente, ele revelou um protótipo do acelerador Vera Rubin Superchip, que combina a novíssima CPU Vera e um par de GPUs Rubin de grande porte em uma única placa. Essa combinação promete um novo nível de desempenho para os supercomputadores de IA do futuro.

Fonte da imagem: Nvidia

Cada GPU Rubin consiste em dois chips grandes com núcleos CUDA e oito pilhas de memória HBM4 de alta velocidade com capacidade de 288 GB. As especificações da GPU, bem como a largura de banda da memória, não são especificadas. No entanto, um único sistema Vera Rubin Superchip é capaz de fornecer 100 petaflops (100 quatrilhões de operações por segundo) de desempenho de IA (FP4).

Quanto à CPU Vera, sabe-se que ela oferece 88 núcleos com base em uma versão não especificada da arquitetura ARM com 176 threads e será conectada às GPUs por meio de uma interface NVLink-C2C com largura de banda de 1,8 TB/s. A placa também contará com RAM LPDDR (a versão não foi especificada, mas é bem possível que seja LPDDR6), elevando a capacidade total de RAM por superchip para 2 TB.

A Nvidia oferecerá uma ampla gama de sistemas baseados nos novos aceleradores, como novas Compute Trays, incluindo uma versão CPX para tarefas com grandes contextos de modelos de IA. A empresa também anunciou racks de servidores Vera Rubin NVL144 prontos para uso, com desempenho de 3,6 EFLOPS (3,6 quintilhões de operações por segundo) para execução de modelos de IA pré-treinados (inferência FP4) e 1,2 EFLOPS para modelos de treinamento (treinamento FP8). Isso é aproximadamente 3,3 vezes mais rápido que os atuais sistemas GB300 NVL72. O sistema oferecerá um total de 13 TB de memória HBM4 e 75 TB de memória de sistema rápida, enquanto a largura de banda total das interfaces NVLink e CX9 atingirá 260 TB/s e 28,8 TB/s, respectivamente.

A Nvidia também revelou detalhes do sistema em chip NVL576 baseado nos chips Rubin Ultra, previsto para o segundo semestre de 2027. Esses chips incluirão quatro grandes chips de GPU em um único wafer e 1 TB de memória HBM4e. O sistema NVL576 oferecerá desempenho de até 15 EFLOPS (FP4) e 5 EFLOPS (FP8), oferecendo até 365 TB de memória de sistema rápida e largura de banda de rede de até 1,5 PB/s via NVLink.

A Nvidia anunciou que as primeiras unidades de teste Rubin já chegaram aos laboratórios da empresa para testes, com produção em massa planejada para 2026. Essa arquitetura será substituída pela arquitetura Feynman completamente nova, com lançamento previsto para 2027-2028. No entanto, a Nvidia ainda não apresentou nenhum chip baseado nessa plataforma; é improvável que eles existam em formato físico neste momento.

admin

Compartilhar
Publicado por
admin

Postagens recentes

A Porsche apresentou o Cayenne elétrico com até 1.139 cv e aceleração de 0 a 100 km/h em 2,4 segundos.

A Porsche adicionou uma versão cupê à sua linha de crossovers elétricos Cayenne. O Cayenne…

22 minutos atrás

Curador: O número de ataques DDoS com intensidade superior a 1 Tbps aumentou significativamente.

A Curator, empresa especializada em garantir a disponibilidade da internet e mitigar ataques DDoS, registrou…

38 minutos atrás

O crossover esportivo Xiaomi YU7 GT será lançado em maio e será capaz de atingir velocidades de até 300 km/h.

Embora as características de tração dos motores elétricos permitam que os veículos elétricos demonstrem uma…

38 minutos atrás

A Xiaomi apresentou os modelos de IA MiMo V2.5 para conversão de texto em fala e de voz.

A Xiaomi apresentou dois modelos de IA projetados para interação por voz. O MiMo-V2.5-TTS converte…

39 minutos atrás

A Samsung criou um visor 2D/3D comutável – sem óculos e sem compromissos.

A Samsung e cientistas da Universidade de Ciência e Tecnologia de Pohang (POSTECH, Coreia do…

1 hora atrás

A Microsoft adicionou o agente de IA Copilot ao Word, Excel e PowerPoint e o disponibilizou para todos os assinantes do Microsoft 365.

A gigante do software anunciou que o Copilot, um assistente de inteligência artificial, já está…

1 hora atrás