O primeiro teste prático da plataforma Intel Arc Pro B60 Battlematrix, publicado pela Storage Review, demonstra um sistema de IA local denso construído com quatro placas gráficas profissionais Arc Pro B60 de chip duplo.

Fonte da imagem: VideoCardz

Cada placa do sistema está equipada com 48 GB de memória de vídeo GDDR6 (24 GB por GPU), resultando em um total de 192 GB de VRAM, ideal para fluxos de trabalho locais com modelos de linguagem complexos, eliminando a sobrecarga da computação em nuvem e problemas de troca de dados.

Fonte da imagem aqui e abaixo: Storage Review

A Intel definiu o preço da Arc Pro B60 com GPU única em torno de US$ 600, portanto, a versão com duas GPUs e 48 GB de memória custa cerca de US$ 1.200. Com essa quantidade de memória de vídeo, o acelerador profissional da Intel é significativamente mais barato (pelo menos metade do preço) do que a maioria das GPUs profissionais com capacidade de memória semelhante de outros fabricantes.

As placas de vídeo Arc Pro B60 não são projetadas para jogos. E a Arc Pro B60 com duas GPUs não é verdadeiramente uma placa de vídeo com duas GPUs no sentido tradicional, como, por exemplo, a GeForce GTX 690 para jogos da Nvidia era na época. A Maxsun, parceira da Intel que forneceu as placas para teste, já explicou que a Arc Pro B60 com duas GPUs é, na verdade, composta por duas placas de vídeo em uma única placa de circuito impresso (PCB), compartilhando um único slot PCIe graças à bifurcação (separação de pistas). Essencialmente, as duas GPUs compartilham uma única PCB e um único slot, mas para o sistema operacional, elas aparecem como duas placas de vídeo separadas. Assim, em vez de quatro placas, o sistema reconhece oito Arc Pro B60, cada uma com 24 GB de memória de vídeo.

Para muitos modelos de linguagem, a eficiência está diretamente ligada ao número de GPUs utilizadas. Quanto menos, melhor. Modelos de linguagem pequenos podem caber na pilha de VRAM de uma única GPU. No entanto, as limitações físicas da memória disponível exigem o uso de mais GPUs, especialmente para modelos de linguagem muito grandes. Isso, por sua vez, impõe certas limitações relacionadas às tecnologias de interconexão, aumentando a latência da distribuição de dados. Uma configuração com oito GPUs torna-se viável quando o nível de paralelismo e o tamanho dos pacotes de dados aumentam, onde a taxa de transferência é mais crítica. Contudo, o software necessário para esse processamento ainda está em estágios iniciais de desenvolvimento. Apenas os modelos GPT-OSS baseados em MXFP4 funcionaram corretamente com caminhos de baixa precisão, enquanto formatos como INT4 padrão, FP8 e AWQ não foram executados, forçando muitos modelos densos a serem executados no formato BF16.

“Em todos os modelos testados, um padrão comum emergiu: em tamanhos de encapsulamento pequenos com nossa configuração de 256 tokens de E/S, usar o número mínimo de GPUs necessário para acomodar o modelo oferece melhor desempenho por usuário do que distribuí-lo entre todas as oito GPUs. A sobrecarga da comunicação entre GPUs via PCIe, mesmo em velocidades PCIe 5.0, resulta em latência que excede os benefícios da paralelização em cenários de usuário único ou baixa concorrência”, escreve a Storage Review.

Fisicamente, as placas Arc Pro B60 com duas GPUs são maiores do que as placas com uma única GPU. Elas são mais compridas, equipadas com um cooler de dois slots e consomem até 400 W por meio de um único conector 12V-2×6. Devido ao comprimento maior da placa, a instalação em alguns gabinetes torre padrão pode ser um desafio. Essas placas se encaixam perfeitamente em gabinetes de servidor.

Os testes da Storage Review utilizaram versões iniciais de drivers, uma versão pré-lançamento do LLM Scaler e um sistema AMD EPYC em vez dos processadores Intel Xeon 6 que se espera que sejam utilizados nas soluções Battlematrix, portanto, todos os dados apresentados são preliminares. A Intel anunciou os sistemas de IA Battlematrix em maio, mas o analista prevê que o hardware e o software estarão totalmente operacionais somente em 2026.

By admin

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *