Categorias: Mercado de tecnologia e TI. notícia

A Cerebras Systems estabeleceu um recorde em aprendizado de máquina para sistemas únicos

O sucesso da Cerebras Systems com seus descendentes incomuns, processadores Cerebras supergrandes que ocupam todo um substrato de silício, é no mínimo interessante de se observar. Seus sistemas são incomuns, mas no campo de aprendizado de máquina eles parecem não ter igual – uma única plataforma Cerebras CS-2 pode substituir quase um cluster inteiro ao treinar um modelo grande. E a empresa provou isso por ação, estabelecendo um novo recorde.

A essência do registro é que o maior modelo de IA do mundo já treinado em um único dispositivo foi treinado no Cerebras CS-2 (sistemas de cluster não contam). É claro que a “singleness” do CS-2 é um tanto arbitrária, mas ainda pode ser considerada como tal, pois um gabinete de equipamento CS-2 contém exatamente um chip WSE-2 e o complexo HPE Superdome Flex, que “alimenta” dados a ele, é considerado auxiliar.

Características comparativas de WSE-1 e WSE-2. Fonte: Cerebras Systems

Estamos falando de treinar um modelo com 20 bilhões de parâmetros, o que nenhum outro sistema no mundo pode fazer. Ao abrir o acesso ao treinamento de redes neurais tão complexas, o Cerebras está atendendo pesquisadores de máquinas de linguagem natural, pois o tempo de treinamento para um modelo sério pode ser reduzido de meses para minutos, eliminando a necessidade de particionamento demorado do modelo entre os nós de um sistema de cluster tradicional – tudo isso é executado no modo “monolítico”.

Projeto do CS-2 e alguns de seus parâmetros técnicos. Fonte: Cerebras Systems

Além disso, modelos desse tamanho exigem muito dinheiro – nem todo pesquisador tem orçamento suficiente para alugar um cluster. Mas o CS-2 democratizará até modelos enormes como GPT-3 1.3B, GPT-J 6B, GPT-3 13B e GPT-NeoX 20B. Seu lançamento tornou-se possível com a última atualização do software proprietário Cerebras Software Platform. Os geneticistas da GSK também estão entusiasmados com a nova oportunidade, usando enormes conjuntos de dados.

Lembre-se que o coração do CS-2, o processador WSE-2, é legitimamente considerado o maior do mundo – contém 850 mil núcleos otimizados para tarefas específicas de aprendizado de máquina. Para “alimentar” esse neuroprocessador com dados e eliminar o tempo de inatividade, são usados 12 canais de uma só vez a uma velocidade de 100 Gb / s. Um superservidor HPE Superdome Flex 280 separado é responsável pelo fornecimento de dados, que por si só tem características muito impressionantes.

avalanche

Próximo Enorme simulador de caça em mundo aberto Way of the Hunter está chegando ao PC e consoles em 16 de agosto »

Anterior « Jogo de tiro cooperativo Deep Rock Galactic atinge novo pico de vendas

Deixar comentário

Publicado por

avalanche

4 anos atrás

Postagens recentes

O mundo da robótica

A Amazon apresenta o Proteus, um robô de armazém totalmente autônomo e controlado por voz.

A Amazon possui mais de um milhão de robôs trabalhando em armazéns, mas até agora,…

42 minutos atrás

Jogos

Laufey não terá que esperar anos por God of War.

Embora a recente revelação de God of War Laufey, o jogo de ação e aventura…

58 minutos atrás

Eventos e eventos da indústria de TI, exposições, fóruns

Destaques do estande da Acer na Computex 2026: 50 anos de inovação, óculos inteligentes, consoles de jogos e dispositivos de última geração.

Este ano, a Acer celebra seu 50º aniversário. Em meio século, a marca evoluiu de…

1 hora atrás

Sistemas de refrigeração

Microsoft: Os modernos centros de dados com IA consomem menos água do que um restaurante.

Os centros de dados para sistemas de inteligência artificial usam tão pouca água que seu…

1 hora atrás

Processadores

A AMD não descarta a possibilidade de lançar um Ryzen 5 9600X3D de seis núcleos ainda este ano.

A AMD ainda não descartou a possibilidade de lançar um processador Ryzen 5 9600X3D de…

2 horas atrás

Sistemas de refrigeração

A Frore apresentou o LiquidJet Nexus, um sistema de refrigeração líquida ultrafino para servidores Nvidia, que oferece uma redução de temperatura de 6°C e aceleração de IA de 10%.

Na Computex 2026 em Taipei, a Frore Systems demonstrou o bloco de água monolítico LiquidJet…