Como era de se esperar, o fundador e CEO da Nvidia, Jensen Huang, aproveitou o palco da CES 2026 não apenas para destacar os produtos e tecnologias mais recentes da empresa, mas também para convencer os investidores de que a bolha da IA ​​está longe de estourar. Um de seus argumentos foi a demonstração de protótipos de aceleradores baseados na arquitetura Rubin.

Eles chegarão ao mercado ainda este ano, no segundo semestre, mas o CEO da Nvidia enfatizou que a produção já está a todo vapor. A arquitetura Rubin é a sucessora da bem-sucedida Blackwell, e a Nvidia não esconde suas grandes expectativas em relação a ela. Respondendo a perguntas da plateia na CES 2026, o fundador da empresa explicou: “Faremos o possível para aumentar as entregas. No segundo semestre, venderemos e enviaremos muitos aceleradores Rubin.” Comparados aos aceleradores Blackwell, os Rubin oferecerão um aumento de cinco vezes no desempenho de inferência e um aumento de três vezes e meia no treinamento de modelos de linguagem. Em ambas as áreas, o custo unitário por token gerado será dez vezes menor do que com a Blackwell, tornando vantajoso para os desenvolvedores migrarem para a Rubin, mesmo que os novos aceleradores sejam significativamente mais caros.

Fonte da imagem: Nvidia

A geração Rubin de GPUs será a primeira da Nvidia a apresentar memória HBM4, que oferece taxas de transferência de dados de até 22 terabytes por segundo. Os provedores de nuvem CoreWeave e Microsoft Azure estarão entre os primeiros clientes da Nvidia a receber aceleradores Rubin no segundo semestre do ano. Amostras dos aceleradores Rubin já estão sendo testadas por clientes da Nvidia.

Um único rack de servidor pode acomodar até 72 GPUs Rubin e 36 CPUs Vera. Um único cluster de computação pode acomodar até 1.000 chips Rubin, com a eficiência de transferência de dados entre eles sendo amplamente determinada pelas novas interfaces de rede introduzidas simultaneamente. Ao trabalhar com inferência no formato de dados NVFP4, que a Nvidia promoverá, os aceleradores Rubin oferecem desempenho na ordem de 50 petaflops. Um aumento significativo no desempenho e na eficiência computacional em comparação com a geração Blackwell foi alcançado com um aumento de apenas 1,6 vezes no número de transistores no chip.

By admin

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *