O rei do acelerador Cerebras WSE-3 treinou sozinho um modelo de IA com 1 trilhão de parâmetros

A Cerebras Systems, em colaboração com o Departamento de Energia dos EUA (DOE) Sandia National Laboratories (SNL), conduziu um experimento bem-sucedido para treinar um modelo de IA com 1 trilhão de parâmetros usando um único sistema CS-3 com um acelerador czar WSE-3 e 55 TB de memória externa MemoryX.

Modelos de treinamento dessa escala normalmente requerem milhares de aceleradores baseados em GPU que consomem megawatts de energia, dezenas de especialistas e semanas de ajustes de hardware e software, diz Cerebras. No entanto, os cientistas do SNL conseguiram treinar o modelo em um único sistema sem fazer alterações no modelo ou no software de infraestrutura. Além disso, eles conseguiram atingir uma escala quase linear – 16 sistemas CS-3 mostraram um aumento de 15,3 vezes na velocidade de aprendizagem.

Fonte da imagem: Cerebras

Um modelo desta escala requer terabytes de memória, milhares de vezes mais do que está disponível em uma única GPU. Em outras palavras, clusters clássicos de milhares de aceleradores devem estar corretamente conectados entre si antes do início do treinamento. Os sistemas Cerebras para armazenamento de balanças usam memória MemoryX externa baseada em nós de 1U com o DDR5 mais comum, tornando tão fácil treinar um modelo com um trilhão de parâmetros quanto um modelo pequeno em um único acelerador, diz a empresa.

Anteriormente, o SNL e a Cerebras implantaram o cluster Kingfisher baseado em sistemas CS-3, que será utilizado como plataforma de teste para o desenvolvimento de tecnologias de IA para garantir a segurança nacional.

avalanche

Postagens recentes

A Microsoft está redesenhando a interface “Começar do zero”: redimensionando, desativando seções e fazendo outros ajustes.

A Microsoft está trabalhando em uma grande atualização para o menu Iniciar do Windows 11,…

60 minutos atrás

“O escudo térmico parecia ótimo”: os astronautas da Artemis II inspecionaram a cápsula após retornarem à Terra.

O escudo térmico da cápsula Orion, apelidado de Integridade pela tripulação, foi alvo de muitos…

1 hora atrás

OpenAI vai adquirir participação na concorrente da Nvidia no mercado de chips de IA.

A OpenAI pagará à desenvolvedora de chips Cerebras mais de US$ 20 bilhões pelo uso…

2 horas atrás

Apple vai corrigir bug de bloqueio do iPhone causado por caractere especial tcheco

A Apple decidiu corrigir um bug que deixou alguns usuários de iPhone impossibilitados de usar…

2 horas atrás

Os desenvolvedores de Heroes of Might & Magic: Olden Era anunciaram um teste multiplayer em larga escala – e a entrada é gratuita.

Os desenvolvedores do estúdio cipriota com raízes russas, Unfrozen, anunciaram planos para realizar testes multiplayer…

2 horas atrás