Nvidia surpreende ao anunciar o chip Rubin CPX AI com 128 GB GDDR7 para processamento de contexto longo

A Nvidia revelou uma unidade de processamento gráfico (GPU) Rubin CPX dedicada com 128 GB de memória. A Rubin CPX é uma GPU projetada para inferência de IA e modelos de longo contexto.

Fonte da imagem: VideoCardz

O Rubin CPX utiliza um design de matriz monolítica e é baseado na arquitetura Rubin. A Nvidia afirma que ele vem com 128 GB de memória GDDR7 e até 30 Pflops de desempenho NVFP4. A GPU inclui quatro unidades NVENC e quatro NVDEC para processamento de vídeo.

Fonte da imagem aqui e abaixo: Hardaweluxx

A Nvidia afirma que o Rubin CPX oferece 3x o desempenho de atenção do GB300 NVL72 ao processar contextos longos.

A Nvidia está apresentando os racks de servidor Vera Rubin NVL144 (sem CPX) como soluções para treinamento de modelos de IA e para inferência. Eles oferecem 3,6 EFLOPS de desempenho NVFP4, 1,4 PB/s de largura de banda de memória HBM4 e 75 TB de armazenamento rápido. Os racks NVL144 estão programados para serem entregues no segundo semestre de 2026 e o ​​NVL144 CPX no final de 2026. A Nvidia informou que iniciou os testes de qualificação do Rubin há algumas semanas.

O Rubin CPX será entregue como parte da plataforma Vera Rubin NVL144 CPX, juntamente com GPUs Rubin e CPUs Vera. Isso pode incluir 144 GPUs Rubin CPX, 144 GPUs Rubin, 36 CPUs Vera (por rack) e 100 TB de memória com 1,7 PB/s de largura de banda de memória. O desempenho computacional será de 8 EFLOPS em operações NVFP4. As soluções de rede e interconexão de redes serão baseadas em NVLink Gen 6, Spectrum-6 e ConnectX-9.

A arquitetura Rubin Ultra, prevista para 2027, aumentará a densidade de GPUs para quatro por módulo e utilizará memória HBM4E. Soluções baseadas na arquitetura Feynman estão planejadas para 2028, juntamente com a transição para NVLink 8, Spectrum-7 e ConnectX-10.

admin

Postagens recentes

Uma galáxia distante explodiu em um aglomerado galáctico e proporcionou um espetáculo de luzes que ocupou metade do céu.

Astrônomos relataram a descoberta de uma radiogaláxia incomum, RAD-BAARG, ao redor da qual se formou…

35 minutos atrás

O Ayaneo Pocket Micro 2, um console portátil compacto com um processador Snapdragon 865 personalizado, foi lançado por US$ 239.

A Ayaneo lançou o Pocket Micro 2, seu segundo console Android em miniatura e formato…

2 horas atrás

Os Raspberry Pi 4 Modelo B com clock reduzido já estão disponíveis para compra.

Uma nova versão do computador de placa única Raspberry Pi 4 Modelo B já está…

4 horas atrás

A Comissão Europeia tomou conhecimento da AWS e do Microsoft Azure.

A Comissão Europeia anunciou que chegou a uma conclusão preliminar para incluir os principais serviços…

4 horas atrás

Um entusiasta conseguiu executar o Windows 11 em um computador com memória DDR, um processador Intel Core 2 Quad e uma placa de vídeo Radeon HD 4650.

A escassez de chips de memória e os preços exorbitantes estão inspirando entusiastas a grandes…

4 horas atrás

O Gemini agora consegue encontrar aplicativos na Play Store por meio de comandos de voz.

A Google Play Store provavelmente tem aplicativos para todos os gostos e necessidades, mas a…

4 horas atrás