Phison descobriu como usar SSDs para reduzir em seis vezes o custo de treinamento de grandes modelos de linguagem

Phison demonstrou no evento Nvidia GTC 2024 uma estação de trabalho com quatro processadores gráficos, que era poderosa o suficiente para treinar um modelo de inteligência artificial com 70 bilhões de parâmetros. Isso foi possível usando os recursos de SSD e DRAM do sistema, relata Tom’s Hardware. Em condições normais, esta tarefa requer seis servidores com 24 aceleradores Nvidia H100 e 1,4 TB de memória de vídeo.

Fonte da imagem: phison.com

A plataforma Phison aiDaptiv+ ajuda a reduzir as barreiras ao treinamento de grandes modelos de linguagem de IA, aproveitando a memória do sistema e SSDs para aumentar a quantidade de memória disponível para GPUs. Esta solução permitirá às empresas reduzir os custos de formação em IA e evitar a escassez de GPU que ameaça a indústria. O desempenho de tal sistema, é claro, é inferior ao de soluções de servidor caras, mas abre a oportunidade para pequenas e médias empresas executarem modelos avançados localmente, garantindo a confidencialidade dos dados se o tempo gasto em treinamento não for crítico.

Fonte da imagem: phison.com

A demonstração usou uma estação de trabalho Maingear Pro AI com processador Intel Xeon W7-3445X, 512 GB de memória DDR5-5600 e dois SSDs Phison aiDaptiveCache ai100E 2 TB M.2 especializados projetados especificamente para armazenar cargas de trabalho em cache. Essas unidades baseadas em chip SLC foram projetadas para suportar 100 ciclos de gravação por dia durante cinco anos. A solução de software aiDaptiv+ da Phison remove camadas do modelo de IA da memória de vídeo que não estão sendo processadas ativamente e as envia para a memória do sistema da máquina; se forem informações necessárias, elas permanecem aqui e os dados de baixa prioridade são descarregados nos SSDs. Eles são movidos para a memória de vídeo da GPU para processamento adicional conforme necessário, e os dados processados ​​são enviados para DRAM e SSD.

Fonte da imagem: tomshardware.com

A estação de trabalho Maingear Pro AI está disponível em diversas versões, de US$ 28 mil para uma versão com um acelerador gráfico Nvidia RTX 6000 Ada A100 a US$ 60 mil para uma configuração com quatro GPUs. O principal parceiro da Phison no fornecimento de equipamentos para a nova plataforma é a Maingear, mas a desenvolvedora também coopera com MSI, Gigabyte, ASUS e Deep Mentor, que estão prontos para oferecer suas soluções.

A biblioteca de middleware aiDaptiv+ da Phison funciona com Pytorch/Tensor Flow e não requer modificação em aplicativos de IA. O custo de treinar um modelo nessa configuração é seis vezes menor do que executá-lo em oito clusters com 30 aceleradores de IA, mas o procedimento leva cerca de quatro vezes mais tempo. Há também a opção de escalonamento horizontal com lançamento de quatro estações de trabalho por pouco mais da metade do custo – neste caso, treinar um modelo com 70 bilhões de parâmetros levará cerca de 1,2 hora, enquanto um sistema com 30 aceleradores de IA fará isso. em 0,8 horas.

avalanche

Postagens recentes

Life is Strange: Reunion – O desespero leva ao sucesso. Análise / Jogos

Jogado no PlayStation 5 Quando Life is Strange: Double Exposure foi lançado, parecia que a…

4 horas atrás

O diretor criativo da Naughty Dog deixou os fãs curiosos com uma foto de sua viagem de negócios — a imagem parece ser uma prévia de Uncharted 5.

Lançados em 2016 e 2017, Uncharted 4: A Thief's End e Uncharted: The Lost Legacy…

7 horas atrás

O avião sem leme X-65 da Boeing está um passo mais perto de voar — ele será controlado por correntes de ar.

A Aurora Flight Sciences, subsidiária da Boeing, anunciou um marco importante no projeto da aeronave…

7 horas atrás

Atualmente, a memória representa até 30% dos custos de construção de data centers — quatro vezes mais do que em 2023.

Os analistas da SemiAnalysis estimam que a memória representará aproximadamente 30% do investimento total de…

8 horas atrás

A Terra é visível pela vigia: o comandante da missão lunar Artemis II enviou fotos deslumbrantes do nosso planeta.

Há algumas horas, a espaçonave Orion e sua tripulação concluíram com sucesso uma manobra de…

8 horas atrás

A MSI lançou o adaptador PCIe sem fio Herald BE9400 com suporte para Wi-Fi 7 e Bluetooth 5.4.

A MSI lançou o adaptador sem fio Herald BE9400 como uma placa de expansão PCIe,…

8 horas atrás