Categorias: Servidores, clusters, supercomputadores, computadores industriais e multiprocessadores

Huang revelou o Vera Rubin Superchip – uma CPU, duas GPUs enormes e 100 petaflops em uma única placa para IA de última geração.

Na conferência GTC 2025, o CEO da Nvidia, Jensen Huang, demonstrou o processador gráfico de próxima geração da empresa, o Rubin. Mais especificamente, ele revelou um protótipo do acelerador Vera Rubin Superchip, que combina a novíssima CPU Vera e um par de GPUs Rubin de grande porte em uma única placa. Essa combinação promete um novo nível de desempenho para os supercomputadores de IA do futuro.

Fonte da imagem: Nvidia

Cada GPU Rubin consiste em dois chips grandes com núcleos CUDA e oito pilhas de memória HBM4 de alta velocidade com capacidade de 288 GB. As especificações da GPU, bem como a largura de banda da memória, não são especificadas. No entanto, um único sistema Vera Rubin Superchip é capaz de fornecer 100 petaflops (100 quatrilhões de operações por segundo) de desempenho de IA (FP4).

Quanto à CPU Vera, sabe-se que ela oferece 88 núcleos com base em uma versão não especificada da arquitetura ARM com 176 threads e será conectada às GPUs por meio de uma interface NVLink-C2C com largura de banda de 1,8 TB/s. A placa também contará com RAM LPDDR (a versão não foi especificada, mas é bem possível que seja LPDDR6), elevando a capacidade total de RAM por superchip para 2 TB.

A Nvidia oferecerá uma ampla gama de sistemas baseados nos novos aceleradores, como novas Compute Trays, incluindo uma versão CPX para tarefas com grandes contextos de modelos de IA. A empresa também anunciou racks de servidores Vera Rubin NVL144 prontos para uso, com desempenho de 3,6 EFLOPS (3,6 quintilhões de operações por segundo) para execução de modelos de IA pré-treinados (inferência FP4) e 1,2 EFLOPS para modelos de treinamento (treinamento FP8). Isso é aproximadamente 3,3 vezes mais rápido que os atuais sistemas GB300 NVL72. O sistema oferecerá um total de 13 TB de memória HBM4 e 75 TB de memória de sistema rápida, enquanto a largura de banda total das interfaces NVLink e CX9 atingirá 260 TB/s e 28,8 TB/s, respectivamente.

A Nvidia também revelou detalhes do sistema em chip NVL576 baseado nos chips Rubin Ultra, previsto para o segundo semestre de 2027. Esses chips incluirão quatro grandes chips de GPU em um único wafer e 1 TB de memória HBM4e. O sistema NVL576 oferecerá desempenho de até 15 EFLOPS (FP4) e 5 EFLOPS (FP8), oferecendo até 365 TB de memória de sistema rápida e largura de banda de rede de até 1,5 PB/s via NVLink.

A Nvidia anunciou que as primeiras unidades de teste Rubin já chegaram aos laboratórios da empresa para testes, com produção em massa planejada para 2026. Essa arquitetura será substituída pela arquitetura Feynman completamente nova, com lançamento previsto para 2027-2028. No entanto, a Nvidia ainda não apresentou nenhum chip baseado nessa plataforma; é improvável que eles existam em formato físico neste momento.

admin

Próximo A OneXPlayer revelou o console portátil OneXFly Apex com um cooler líquido e o processador móvel Ryzen avalanche noticias mais potente. »

Anterior « Demissões em massa na Amazon atingiram duramente sua divisão de jogos, à medida que a empresa se afasta do desenvolvimento de MMOs.

Deixar comentário

Publicado por

admin

8 meses atrás

Postagens recentes

Programas

A gigante chinesa Meituan revelou seu modelo de IA de código aberto, LongCat-2.0, com 1,6 trilhão de parâmetros, treinado exclusivamente em chips chineses.

A gigante chinesa de entrega de comida Meituan anunciou o lançamento de seu modelo de…

16 minutos atrás

Jogos

O reboot do Xbox não afetará o OD; o misterioso jogo de terror de Kojima está a salvo por enquanto.

Citando suas próprias fontes, a IGN esclareceu o destino do misterioso jogo de terror da…

37 minutos atrás

Jogos

A Xbox retirou o financiamento do jogo de RPG de fantasia Project Fantasy, dos criadores de Hitman e 007 First Light.

O jogo de ação e espionagem 007 First Light, lançado recentemente, foi um enorme sucesso…

60 minutos atrás

Notícias da rede

O Google finalmente permite que o “pai da internet” se aposente.

Na próxima semana, Vinton Cerf, conhecido como o "pai da internet", se aposentará, encerrando uma…

60 minutos atrás

Inteligência Artificial, Aprendizado de Máquina, Redes Neurais

O Google ensinou o NotebookLM a transformar palestras e apresentações tediosas em vídeos no estilo TikTok.

O Google NotebookLM oferece aos usuários um novo formato para resumir suas anotações: vídeos gerados…

1 hora atrás

Módulos de RAM, cartões de memória, pen drives, leitores de cartões

A inteligência artificial mudou o mercado de memória para sempre: a escassez persistirá até 2028 e não se espera uma redução de preços.

Os fabricantes de memória não são os únicos que acreditam que a escassez neste mercado…

1 hora atrás