e39f6cee6203d1c531114b8322a7d2e7-9222708
O anúncio do processador da Cerebras – o Mecanismo de Esquema Wafer Cerebras (WSE) ou o mecanismo de escala de silício Cerebras – ocorreu na conferência anual Hot Chips 31. Olhando para este monstro de silício, não é surpreendente que tenha sido capaz de o libertar. A ousadia do plano e o trabalho de desenvolvedores que arriscaram desenvolver um cristal com uma área de 46,225 milímetros quadrados com lados de 21,5 cm são surpreendentes. A fabricação de um único processador ocupa uma placa inteira de 300 mm. Ao menor erro, a taxa de casamento é de 100%, e o preço da questão é difícil de imaginar.

O cristal Cerebras é 56,7 vezes maior que o maior GPU NVIDIA do mundo

Cerebras WSE é lançado pela TSMC. O processo de fabricação é de 16 nmFinFET. A produção de tal chip exigiu uma habilidade superior e a solução de muitos problemas, mas valeu a pena, garantem os desenvolvedores. O chip Cerebras é na verdade um supercomputador de chips com largura de banda incrível, consumo de energia mínimo e fantástica simultaneidade. No momento, esta é a solução ideal para aprendizado de máquina, que permitirá aos pesquisadores começar a resolver problemas de extrema complexidade.

Fonte da imagem – AnandTech

Cada chip Cerebras WSE contém 1,2 trilhão de transistores organizados em 400.000 núcleos de processamento otimizados para IA e 18 GB de memória distribuída local SRAM. Tudo isso está conectado por uma rede de malha com uma capacidade total de 100 petabits por segundo. É a arquitetura ideal para acelerar as tarefas relacionadas à IA. Números nus: em comparação com os núcleos gráficos mais modernos, o chip Cerebras fornece 3.000 vezes mais memória no chip e mais 10.000 velocidades de transferência de memória.

Fonte da imagem – AnandTech

Núcleos de computação cerebral – SLAC (Núcleos de Álgebra Linear Esparsa) – são totalmente programáveis ​​e podem ser otimizados para trabalhar com qualquer rede neural. Além disso, a arquitetura do kernel inicialmente filtra os dados representados por zeros. Isso libera recursos computacionais da necessidade de realizar operações inativas de multiplicação por zero, o que, para uma carga de dados esparsa, significa cálculos mais rápidos e máxima eficiência energética. Assim, o processador Cerebras acaba sendo centenas ou mesmo milhares de vezes mais eficiente para aprendizado de máquina em termos de área de chip envolvida e seu consumo do que as soluções atuais para IA e aprendizado de máquina.

Montagem do processador personalizado (Image Source – AnandTech)

Fazer um chip desse tamanho exigiu muitas soluções exclusivas. A remoção de calor tornou-se possível apenas com líquido e somente com a organização do suprimento zonal com circulação vertical. No entanto, todos os problemas foram resolvidos e o chip saiu funcionando. Será interessante aprender sobre sua aplicação prática.

Resolvendo problemas de resfriamento e energia (fonte da imagem – AnandTech)

.

By admin

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *