A Nvidia revelou uma unidade de processamento gráfico (GPU) Rubin CPX dedicada com 128 GB de memória. A Rubin CPX é uma GPU projetada para inferência de IA e modelos de longo contexto.

Fonte da imagem: VideoCardz

O Rubin CPX utiliza um design de matriz monolítica e é baseado na arquitetura Rubin. A Nvidia afirma que ele vem com 128 GB de memória GDDR7 e até 30 Pflops de desempenho NVFP4. A GPU inclui quatro unidades NVENC e quatro NVDEC para processamento de vídeo.

Fonte da imagem aqui e abaixo: Hardaweluxx

A Nvidia afirma que o Rubin CPX oferece 3x o desempenho de atenção do GB300 NVL72 ao processar contextos longos.

A Nvidia está apresentando os racks de servidor Vera Rubin NVL144 (sem CPX) como soluções para treinamento de modelos de IA e para inferência. Eles oferecem 3,6 EFLOPS de desempenho NVFP4, 1,4 PB/s de largura de banda de memória HBM4 e 75 TB de armazenamento rápido. Os racks NVL144 estão programados para serem entregues no segundo semestre de 2026 e o ​​NVL144 CPX no final de 2026. A Nvidia informou que iniciou os testes de qualificação do Rubin há algumas semanas.

O Rubin CPX será entregue como parte da plataforma Vera Rubin NVL144 CPX, juntamente com GPUs Rubin e CPUs Vera. Isso pode incluir 144 GPUs Rubin CPX, 144 GPUs Rubin, 36 CPUs Vera (por rack) e 100 TB de memória com 1,7 PB/s de largura de banda de memória. O desempenho computacional será de 8 EFLOPS em operações NVFP4. As soluções de rede e interconexão de redes serão baseadas em NVLink Gen 6, Spectrum-6 e ConnectX-9.

A arquitetura Rubin Ultra, prevista para 2027, aumentará a densidade de GPUs para quatro por módulo e utilizará memória HBM4E. Soluções baseadas na arquitetura Feynman estão planejadas para 2028, juntamente com a transição para NVLink 8, Spectrum-7 e ConnectX-10.

By admin

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *