Híbrido de baixo custo: Intel combina aceleradores Gaudi 3 e NVIDIA B200 em uma única plataforma de IA

A Intel Corporation revelou um sistema de rack híbrido. O dispositivo conecta os conjuntos de aceleradores Gaudi3 e NVIDIA B200 via Ethernet.

A plataforma Gaudi3 Rack Scale 64 contém até 16 nós de computação. Cada um é equipado com dois processadores Intel Xeon sem nome, quatro aceleradores Intel Gaudi 3 OAM (64 em um único domínio), quatro adaptadores NVIDIA ConnectX-7 400GbE e uma DPU NVIDIA BlueField-3, de acordo com a SemiAnalysis. Um total de 8,2 TB de HBM2e está disponível, com uma taxa de transferência agregada de 76,8 TB/s. O superacelerador tem uma potência de 120 kW. Além disso, são utilizados 12 switches baseados em chips Broadcom Tomahawk 5 (51,2 Tbps). A Ethernet é usada para escalonamento e comunicação com outros nós, incluindo a NVIDIA.

No sistema híbrido, os aceleradores Intel Gaudi 3 são usados ​​para a etapa de decodificação, ou seja, geração de tokens, onde a capacidade de memória e a largura de banda são críticas, enquanto os chips NVIDIA B200 são responsáveis ​​pelas tarefas de pré-preenchimento de inferência, ou seja, processamento de contexto e preenchimento de KVCache, onde a velocidade computacional é crucial. A NVIDIA está adotando a mesma abordagem e já anunciou os coaceleradores Rubin CPX, que lidarão com o processamento de contexto em modelos ultragrandes e a criação de KVCache.

Fonte da imagem: Intel

A Intel afirma que uma configuração híbrida de Gaudi3 e B200 oferece um ganho de 1,7x no custo total de propriedade (TCO) por dólar em comparação com plataformas que utilizam apenas o B200. No entanto, como observado, essas alegações ainda não foram validadas por testes independentes. Além disso, a plataforma de software Gaudi3 fica atrás da plataforma da NVIDIA e é de código fechado. Além disso, a arquitetura atual do Gaudi está se aproximando do fim de sua vida útil, lançando dúvidas sobre a viabilidade a longo prazo da plataforma proposta.

Para a Intel, esta pode ser uma das poucas chances de vender o Gaudi3 restante. Enquanto isso, a Intel anunciou recentemente o acelerador de GPU Crescent Island, projetado especificamente para inferência de IA. Baseada na arquitetura Xe3P, a solução contará com 160 GB de memória LPDDR5X. As remessas em massa não são esperadas antes de 2027. A empresa havia abandonado os planos de lançar o Falcon Shores, concentrando-se no Jaguar Shores. Agora, a empresa começou a descontinuar o suporte aos aceleradores Ponte Vecchio (Intel Max) e Arctic Sound (Flex).

admin

Postagens recentes

A primeira turbina a gás do mundo com 30 MW movida a hidrogênio puro foi lançada na China.

A primeira turbina a gás de 30 megawatts do mundo, construída na China e movida…

3 horas atrás

A China vai proibir carros elétricos com maçanetas retráteis a partir de 2027.

A China vai proibir a venda de novos veículos elétricos equipados com maçanetas retráteis. Esse…

4 horas atrás

A fabricante chinesa Zephyr relatou falhas na placa de vídeo Radeon RX 6000 devido a rachaduras, inchaço e curto-circuito na GPU.

Em 2023, começaram a surgir relatos de falhas em placas gráficas Radeon RX 6000 baseadas…

5 horas atrás

A TSMC evacuou algumas de suas fábricas devido ao terremoto.

A TSMC de Taiwan, maior fabricante de chips sob encomenda do mundo, informou no sábado…

8 horas atrás

Entusiastas chineses começaram a aumentar a memória de vídeo da GeForce RTX 5080 para 32 GB.

Especialistas chineses em reparo de placas de vídeo descobriram uma maneira de aumentar a memória…

9 horas atrás