Um construtor em vez de um monólito: NVIDIA deu mais liberdade na customização do GB300 NVL72

Para os novos superaceleradores (G)B300, a NVIDIA mudou significativamente a cadeia de suprimentos, tornando-a mais amigável para os hiperscaladores, ou seja, os principais clientes dos novos produtos, relata SemiAnalysis. No caso do GB200, a empresa forneceu placas Bianca prontas e totalmente integradas, incluindo aceleradores Blackwell, CPU Grace, 512 GB de LPDDR5X soldado, VRM, etc. O GB300 será fornecido na forma de módulos: SXM Puck B300, CPU Grace em pacote BGA, HMC da Axiado (em vez de Aspeed). E módulos LPCAMM, principalmente da Micron, serão usados ​​como RAM do sistema.

A transição para o SXM Puck permitirá que mais fornecedores OEM e ODM, bem como os próprios hiperscaladores, criem novos sistemas. Se antes apenas Wistron e Foxconn conseguiam produzir placas Bianca, agora outras podem participar do processo de montagem do acelerador. A Wistron será a que mais perderá com esta decisão, pois perderá participação de mercado dos fabricantes Bianca. Para a Foxconn, que graças à NVIDIA está prestes a se tornar a maior fornecedora mundial de servidores, a perda é compensada pela produção exclusiva do SXM Puck.

Fonte da imagem: NVIDIA

Outra mudança importante diz respeito ao VRM. Embora o SXM Puck tenha alguns componentes VRM, a maioria dos componentes restantes serão adquiridos por hiperscaladores e fornecedores diretamente de fornecedores de VRM. Os NVSwitches de montagem em rack e o backplane de cobre continuarão a ser fornecidos pela própria NVIDIA. Para o GB300, a empresa oferece a plataforma 800G InfiniBand/Ethernet Quantum-X800/Spectrum-X800 com adaptadores ConnectX-8, que não foram incluídos no GB200 devido a inconsistências no momento de lançamento dos produtos. Além disso, o ConnectX-8 possui 48 pistas PCIe 6.0 ao mesmo tempo, o que permite criar arquiteturas exclusivas, como o MGX B300A refrigerado a ar.

É relatado que todos os principais hiperscaladores já decidiram migrar para o GB300. Isto se deve em parte ao maior desempenho e eficiência do GB300, mas também ao fato de que agora eles podem personalizar a plataforma, o sistema de refrigeração, etc. Por exemplo, a Amazon poderia finalmente usar sua própria placa-mãe refrigerada a água e retornar à arquitetura NVL72, melhorando o TCO. Anteriormente, a empresa era o único grande player a escolher a opção NVL36 menos eficiente devido ao uso de seus próprios adaptadores 200G e switches PCIe refrigerados a ar.

No entanto, há uma desvantagem: os hiperescaladores terão que gastar mais tempo e recursos projetando e testando o produto. Esta é talvez a plataforma mais complexa que os hiperescaladores já tiveram que projetar (com exceção das plataformas Google TPU), observou o recurso SemiAnalysis.

avalanche

Postagens recentes

Nvidia lançará plataforma para robôs humanóides Jetson Thor no primeiro semestre de 2025

A maior fabricante de aceleradores para resolução de problemas na área de inteligência artificial, representada…

6 horas atrás