A Nvidia revelou uma unidade de processamento gráfico (GPU) Rubin CPX dedicada com 128 GB de memória. A Rubin CPX é uma GPU projetada para inferência de IA e modelos de longo contexto.
Fonte da imagem: VideoCardz
O Rubin CPX utiliza um design de matriz monolítica e é baseado na arquitetura Rubin. A Nvidia afirma que ele vem com 128 GB de memória GDDR7 e até 30 Pflops de desempenho NVFP4. A GPU inclui quatro unidades NVENC e quatro NVDEC para processamento de vídeo.
Fonte da imagem aqui e abaixo: Hardaweluxx
A Nvidia afirma que o Rubin CPX oferece 3x o desempenho de atenção do GB300 NVL72 ao processar contextos longos.
A Nvidia está apresentando os racks de servidor Vera Rubin NVL144 (sem CPX) como soluções para treinamento de modelos de IA e para inferência. Eles oferecem 3,6 EFLOPS de desempenho NVFP4, 1,4 PB/s de largura de banda de memória HBM4 e 75 TB de armazenamento rápido. Os racks NVL144 estão programados para serem entregues no segundo semestre de 2026 e o NVL144 CPX no final de 2026. A Nvidia informou que iniciou os testes de qualificação do Rubin há algumas semanas.
O Rubin CPX será entregue como parte da plataforma Vera Rubin NVL144 CPX, juntamente com GPUs Rubin e CPUs Vera. Isso pode incluir 144 GPUs Rubin CPX, 144 GPUs Rubin, 36 CPUs Vera (por rack) e 100 TB de memória com 1,7 PB/s de largura de banda de memória. O desempenho computacional será de 8 EFLOPS em operações NVFP4. As soluções de rede e interconexão de redes serão baseadas em NVLink Gen 6, Spectrum-6 e ConnectX-9.
A arquitetura Rubin Ultra, prevista para 2027, aumentará a densidade de GPUs para quatro por módulo e utilizará memória HBM4E. Soluções baseadas na arquitetura Feynman estão planejadas para 2028, juntamente com a transição para NVLink 8, Spectrum-7 e ConnectX-10.
O portal GSM Arena publicou os resultados de um estudo comparativo entre os processadores móveis…
A WisdPi lançou a placa de expansão PROM21 All-In, com preço de US$ 199. Por…
A desenvolvedora americana ArenaNet, pertencente à gigante sul-coreana NCSoft, revelou oficialmente Guild Wars 3. Este…
Antes de seu IPO, cuja data ainda não foi definida, a OpenAI planeja lançar a…
A OpenAI introduziu um novo recurso para seu chatbot de IA ChatGPT, o Modo de…
A Molex apresentou um barramento multicanal com refrigeração líquida, projetado para uso em data centers…