A NVIDIA iniciou a produção limitada de seus superchips Grace Blackwell GB300 para cargas de trabalho de IA exigentes, relata o DigiTimes. As entregas estão previstas para começar em setembro, com os volumes de produção aumentando ao longo do tempo.

A solução GB300 é um pacote do processador Grace Arm com 72 núcleos Neoverse V2 e dois chips Blackwell Ultra. O equipamento inclui 288 GB de memória HBM3E com taxa de transferência de até 8 TB/s. O acelerador GB300 é a base do sistema de rack GB300 NVL72, que possui 36 chips Grace e 72 processadores Blackwell Ultra. O desempenho de IA desse complexo atinge 720 Pflops em operações FP8/FP6.

«”Neste momento, não há problemas sérios com o GB300. As entregas devem ocorrer sem problemas a partir do segundo semestre”, disseram representantes de um dos fabricantes ODM.

Fonte da imagem: NVIDIA

Ao mesmo tempo, como observado, a alta demanda por aceleradores GB200 permanece. Os clientes continuam comprando esses produtos, apesar das dificuldades com o resfriamento. O enorme poder de computação e a maior densidade dos layouts de servidores exigiram o uso de sistemas de dissipação de calor líquido. No entanto, isso levou a problemas com vazamentos. Descobriu-se que, em muitos casos, isso se deve a conexões de liberação rápida, que nem sempre atendem aos requisitos necessários, mesmo após testes de estresse na fábrica. Os fabricantes de ODM observam que as condições reais de operação variam muito em termos de pressão da água e projeto da tubulação, o que dificulta a eliminação completa de vazamentos. O serviço pós-venda exige tempo e custos financeiros significativos.

No caso do GB200, os principais desafios foram causados pela transição da arquitetura Hopper para a Blackwell, que resultou em mudanças complexas na plataforma. Por outro lado, o GB300 utiliza a infraestrutura existente e, portanto, não se espera que tenha grandes problemas na produção e no fornecimento desses produtos. Os ODMs que atualmente testam ativamente o GB300 estão relatando resultados encorajadores. Espera-se que a transição ocorra sem problemas, com embarques em massa planejados para o terceiro trimestre, com o aumento da produção ocorrendo no último trimestre deste ano.

Novos desafios podem surgir com o surgimento da próxima geração da família de aceleradores Rubin, que substituirá o Blackwell Ultra no segundo semestre de 2026. Essa plataforma envolve o uso de chiplets e um rack Kyber completamente novo (para VR300 NVL 576), que substituirá o projeto atual do Oberon. A densidade do layout aumentará para 600 kW por rack, o que exigirá sistemas de resfriamento ainda mais confiáveis. Vale ressaltar que o uso de resfriamento líquido se tornará obrigatório para os superaceleradores Rubin.

Ao mesmo tempo, pode haver problemas com a restauração da produção dos aceleradores de H20 enfraquecidos, cujo fornecimento à China foi novamente autorizado pelos Estados Unidos. Conforme relatado pela Reuters com referência ao The Information, a TSMC conseguiu transferir as linhas de produção que eram usadas para H20 para a produção de outros produtos. A restauração completa da produção de H20 pode levar nove meses.

By admin

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *