Nvidia surpreende ao anunciar o chip Rubin CPX AI com 128 GB GDDR7 para processamento de contexto longo

A Nvidia revelou uma unidade de processamento gráfico (GPU) Rubin CPX dedicada com 128 GB de memória. A Rubin CPX é uma GPU projetada para inferência de IA e modelos de longo contexto.

Fonte da imagem: VideoCardz

O Rubin CPX utiliza um design de matriz monolítica e é baseado na arquitetura Rubin. A Nvidia afirma que ele vem com 128 GB de memória GDDR7 e até 30 Pflops de desempenho NVFP4. A GPU inclui quatro unidades NVENC e quatro NVDEC para processamento de vídeo.

Fonte da imagem aqui e abaixo: Hardaweluxx

A Nvidia afirma que o Rubin CPX oferece 3x o desempenho de atenção do GB300 NVL72 ao processar contextos longos.

A Nvidia está apresentando os racks de servidor Vera Rubin NVL144 (sem CPX) como soluções para treinamento de modelos de IA e para inferência. Eles oferecem 3,6 EFLOPS de desempenho NVFP4, 1,4 PB/s de largura de banda de memória HBM4 e 75 TB de armazenamento rápido. Os racks NVL144 estão programados para serem entregues no segundo semestre de 2026 e o ​​NVL144 CPX no final de 2026. A Nvidia informou que iniciou os testes de qualificação do Rubin há algumas semanas.

O Rubin CPX será entregue como parte da plataforma Vera Rubin NVL144 CPX, juntamente com GPUs Rubin e CPUs Vera. Isso pode incluir 144 GPUs Rubin CPX, 144 GPUs Rubin, 36 CPUs Vera (por rack) e 100 TB de memória com 1,7 PB/s de largura de banda de memória. O desempenho computacional será de 8 EFLOPS em operações NVFP4. As soluções de rede e interconexão de redes serão baseadas em NVLink Gen 6, Spectrum-6 e ConnectX-9.

A arquitetura Rubin Ultra, prevista para 2027, aumentará a densidade de GPUs para quatro por módulo e utilizará memória HBM4E. Soluções baseadas na arquitetura Feynman estão planejadas para 2028, juntamente com a transição para NVLink 8, Spectrum-7 e ConnectX-10.

admin

Postagens recentes

A Basalt SPO convida você para a 21ª conferência anual “Software Livre no Ensino Superior”.

A Basalt SPO, em colaboração com o Instituto de Sistemas de Software A.K. Ailamazyan da…

50 minutos atrás

Os primeiros laptops para jogos com chips Nvidia Arm serão lançados neste trimestre, caso os rumores se confirmem.

Há mais de dois anos, tornou-se público que a Nvidia estava se preparando para lançar…

50 minutos atrás

O hipercabo submarino SUBCO APX East ligará diretamente a Austrália à Califórnia.

A SUBCO (Secure Undersea Network Systems) anunciou o cabo submarino APX East, que conectará as…

1 hora atrás

A mineradora de criptomoedas Riot Platforms mudará seu perfil e alugará 25 MW de capacidade de data center para a AMD.

A empresa de mineração de criptomoedas Riot Platforms (anteriormente Riot Blockchain) é a mais recente…

2 horas atrás

A Sony transferiu o controle de sua divisão de TVs Bravia para a empresa chinesa TCL.

A Sony e a TCL assinaram um acordo não vinculativo para criar uma joint venture…

2 horas atrás

A China devolveu à Terra a espaçonave Shenzhou-20 com uma rachadura em sua vigia.

A espaçonave chinesa Shenzhou-20 retornou à Terra em segurança em 19 de janeiro de 2026,…

2 horas atrás