O anúncio do processador da Cerebras – o Mecanismo de Esquema Wafer Cerebras (WSE) ou o mecanismo de escala de silício Cerebras – ocorreu na conferência anual Hot Chips 31. Olhando para este monstro de silício, não é surpreendente que tenha sido capaz de o libertar. A ousadia do plano e o trabalho de desenvolvedores que arriscaram desenvolver um cristal com uma área de 46,225 milímetros quadrados com lados de 21,5 cm são surpreendentes. A fabricação de um único processador ocupa uma placa inteira de 300 mm. Ao menor erro, a taxa de casamento é de 100%, e o preço da questão é difícil de imaginar.
O cristal Cerebras é 56,7 vezes maior que o maior GPU NVIDIA do mundo
Cerebras WSE é lançado pela TSMC. O processo de fabricação é de 16 nmFinFET. A produção de tal chip exigiu uma habilidade superior e a solução de muitos problemas, mas valeu a pena, garantem os desenvolvedores. O chip Cerebras é na verdade um supercomputador de chips com largura de banda incrível, consumo de energia mínimo e fantástica simultaneidade. No momento, esta é a solução ideal para aprendizado de máquina, que permitirá aos pesquisadores começar a resolver problemas de extrema complexidade.
Fonte da imagem – AnandTech
Cada chip Cerebras WSE contém 1,2 trilhão de transistores organizados em 400.000 núcleos de processamento otimizados para IA e 18 GB de memória distribuída local SRAM. Tudo isso está conectado por uma rede de malha com uma capacidade total de 100 petabits por segundo. É a arquitetura ideal para acelerar as tarefas relacionadas à IA. Números nus: em comparação com os núcleos gráficos mais modernos, o chip Cerebras fornece 3.000 vezes mais memória no chip e mais 10.000 velocidades de transferência de memória.
Fonte da imagem – AnandTech
Núcleos de computação cerebral – SLAC (Núcleos de Álgebra Linear Esparsa) – são totalmente programáveis e podem ser otimizados para trabalhar com qualquer rede neural. Além disso, a arquitetura do kernel inicialmente filtra os dados representados por zeros. Isso libera recursos computacionais da necessidade de realizar operações inativas de multiplicação por zero, o que, para uma carga de dados esparsa, significa cálculos mais rápidos e máxima eficiência energética. Assim, o processador Cerebras acaba sendo centenas ou mesmo milhares de vezes mais eficiente para aprendizado de máquina em termos de área de chip envolvida e seu consumo do que as soluções atuais para IA e aprendizado de máquina.
Montagem do processador personalizado (Image Source – AnandTech)
Fazer um chip desse tamanho exigiu muitas soluções exclusivas. A remoção de calor tornou-se possível apenas com líquido e somente com a organização do suprimento zonal com circulação vertical. No entanto, todos os problemas foram resolvidos e o chip saiu funcionando. Será interessante aprender sobre sua aplicação prática.
Resolvendo problemas de resfriamento e energia (fonte da imagem – AnandTech)
.
A chinesa HoYoverse, desenvolvedora do Genshin Impact, concordou em pagar uma multa de US$ 20…
Em antecipação ao anúncio das novas placas de vídeo AMD, imagens ao vivo dos aceleradores…
De acordo com a decisão da Suprema Corte dos EUA, o serviço de vídeos curtos…
O serviço de vídeos curtos TikTok parou de funcionar nos Estados Unidos. Isto aconteceu após…
As sanções dos EUA contra a China visam travar o desenvolvimento tecnológico deste último país,…
Dois grupos de pesquisa independentes relataram um avanço no desenvolvimento de baterias de lítio-enxofre que…