Híbrido de baixo custo: Intel combina aceleradores Gaudi 3 e NVIDIA B200 em uma única plataforma de IA

A Intel Corporation revelou um sistema de rack híbrido. O dispositivo conecta os conjuntos de aceleradores Gaudi3 e NVIDIA B200 via Ethernet.

A plataforma Gaudi3 Rack Scale 64 contém até 16 nós de computação. Cada um é equipado com dois processadores Intel Xeon sem nome, quatro aceleradores Intel Gaudi 3 OAM (64 em um único domínio), quatro adaptadores NVIDIA ConnectX-7 400GbE e uma DPU NVIDIA BlueField-3, de acordo com a SemiAnalysis. Um total de 8,2 TB de HBM2e está disponível, com uma taxa de transferência agregada de 76,8 TB/s. O superacelerador tem uma potência de 120 kW. Além disso, são utilizados 12 switches baseados em chips Broadcom Tomahawk 5 (51,2 Tbps). A Ethernet é usada para escalonamento e comunicação com outros nós, incluindo a NVIDIA.

No sistema híbrido, os aceleradores Intel Gaudi 3 são usados ​​para a etapa de decodificação, ou seja, geração de tokens, onde a capacidade de memória e a largura de banda são críticas, enquanto os chips NVIDIA B200 são responsáveis ​​pelas tarefas de pré-preenchimento de inferência, ou seja, processamento de contexto e preenchimento de KVCache, onde a velocidade computacional é crucial. A NVIDIA está adotando a mesma abordagem e já anunciou os coaceleradores Rubin CPX, que lidarão com o processamento de contexto em modelos ultragrandes e a criação de KVCache.

Fonte da imagem: Intel

A Intel afirma que uma configuração híbrida de Gaudi3 e B200 oferece um ganho de 1,7x no custo total de propriedade (TCO) por dólar em comparação com plataformas que utilizam apenas o B200. No entanto, como observado, essas alegações ainda não foram validadas por testes independentes. Além disso, a plataforma de software Gaudi3 fica atrás da plataforma da NVIDIA e é de código fechado. Além disso, a arquitetura atual do Gaudi está se aproximando do fim de sua vida útil, lançando dúvidas sobre a viabilidade a longo prazo da plataforma proposta.

Para a Intel, esta pode ser uma das poucas chances de vender o Gaudi3 restante. Enquanto isso, a Intel anunciou recentemente o acelerador de GPU Crescent Island, projetado especificamente para inferência de IA. Baseada na arquitetura Xe3P, a solução contará com 160 GB de memória LPDDR5X. As remessas em massa não são esperadas antes de 2027. A empresa havia abandonado os planos de lançar o Falcon Shores, concentrando-se no Jaguar Shores. Agora, a empresa começou a descontinuar o suporte aos aceleradores Ponte Vecchio (Intel Max) e Arctic Sound (Flex).

admin

Postagens recentes

Imagens de alta qualidade do Samsung Galaxy S26 e S26+ vazaram online antes do anúncio.

A Samsung está se preparando para apresentar uma nova série de smartphones, incluindo o Galaxy…

13 horas atrás

Arknights: Endfield – E se Satisfactory fosse um gacha chinês? Análise / Jogos

Processador Intel Core i5-9400F de 2,9 GHz ou equivalente AMD, 16 GB de RAM, placa…

15 horas atrás

Arknights: Endfield – E se Satisfactory fosse um gacha chinês? Análise.

Intel Core i5-9400F 2.9 GHz ou equivalente AMD, 16 GB de RAM, placa de vídeo…

15 horas atrás

As neonuvens estão absorvendo dados de IA como buracos negros, alterando o comportamento da rede.

A Backblaze, provedora de armazenamento em nuvem, publicou seu relatório de Estatísticas de Rede do…

16 horas atrás

Editoras musicais processaram a Anthropic em US$ 3 bilhões por “pirataria descarada”.

Um grupo de editoras musicais, liderado pela Concord Music Group e pela Universal Music Group…

17 horas atrás

Os finlandeses começaram a fabricar cerveja “na areia” — uma cervejaria local instalou um acumulador de calor na areia.

A empresa finlandesa TheStorage lançou seu primeiro sistema industrial de armazenamento de calor à base…

17 horas atrás