Em um esforço para manter sua liderança em aceleradores de IA e computação de alto desempenho (HPC), a NVIDIA planeja acelerar o desenvolvimento de novas arquiteturas de GPU e, de fato, retornar a um cronograma anual de lançamento de novos produtos. A julgar pelos planos apresentados aos investidores, as GPUs da geração Blackwell deverão ser lançadas em 2024, e já em 2025 serão substituídas por uma nova arquitetura, que ainda não tem nome e é designada como X.
Antes do lançamento do Blackwell, previsto para o segundo semestre do próximo ano, a NVIDIA apresentará vários novos produtos baseados em sua atual arquitetura Hopper. Espera-se o acelerador H200, baseado no H100, assim como o GH200NVL, projetado para funcionar com modelos de linguagem grande (LLM) em conjunto com processadores Arm.
Na família Blackwell, a NVIDIA provavelmente apresentará o acelerador de computação B100 para plataformas x86 em 2024, que substituirá o H100. A empresa também está preparando o GB200, que supostamente é um sucessor do sistema de computação Grace Hopper, que combina um processador Arm e uma GPU Hopper. E também haverá o GB200NVL, uma solução baseada em Arm para aprender e trabalhar com LLM. Os planos também apresentam um produto B40, presumivelmente uma solução cliente baseada em GPU para inferência de IA.
Em 2025, a Blackwell será substituída por uma arquitetura atualmente designada X. Semelhante à geração Blackwell, serão apresentados os produtos X100, GX200 e GX200NVL. No segmento de consumo, o X40 substituirá o B40.
A NVIDIA atualmente lidera o mercado de GPUs de IA, mas AWS, Google, Microsoft, AMD e outros players de IA e HPC estão preparando suas próprias soluções de IA, então a NVIDIA é forçada a reagir e ajustar seus planos.
É relatado que, para fortalecer ainda mais sua posição, a NVIDIA reservou antecipadamente a capacidade da TSMC e comprou memória HBM de todos os três fabricantes globais. Paralelamente, a empresa está promovendo seus servidores HGX e MGX, com o objetivo de comercializar essas máquinas e torná-las populares entre os usuários finais, principalmente no segmento empresarial de inteligência artificial.