Categorias: Mercado de tecnologia e TI. notícia

SambaNova apresentou o processador SN40L AI com memória HBM3, que é muitas vezes mais rápido que os aceleradores GPU

O boom em modelos de grandes linguagens inevitavelmente traz ao mercado uma nova classe especializada de processadores – e muitas vezes essas soluções acabam sendo mais eficientes do que a abordagem tradicional de GPU.

A SambaNova Systems, desenvolvedora de tais processadores e sistemas baseados neles, lançou uma nova terceira geração de processadores de IA chamada SN40L.

Fonte das imagens aqui e abaixo: SambaNova via EE Times

No outono de 2022, a empresa lançou o chip SN30 baseado em uma arquitetura única de blocos controlados por programa, mesmo então plenamente consciente da tendência de aumento do volume de dados em redes neurais: o chip recebeu 640 MB de cache SRAM e foi equipado com 1 TB de RAM.

Este desenvolvimento formou a base do mais novo SN40L. Devido à transição da tecnologia de processo de 7 nm da TSMC para o processo mais avançado de 5 nm, os desenvolvedores conseguiram aumentar o número de núcleos para 1.040, mas sua arquitetura permaneceu a mesma. No entanto, tendo em conta a reconfigurabilidade, isto não é uma desvantagem.

A arquitetura de blocos SambaNova consiste em blocos de computação PCU, blocos PMU SRAM, lógica de controle e interconexão de malha

O chip SN40L consiste em dois chips grandes, que respondem por 520 MB de cache SRAM, 1,5 TB de DRAM DDR5 e 64 GB de HBM3 de alta velocidade. Este último foi adicionado ao SN40L como um buffer entre a SRAM ultrarrápida e a DRAM relativamente lenta. Isto deve melhorar o desempenho do chip ao operar no modo de inferência LLM. Para usar o HBM3 de maneira eficaz, a pilha de software SambaNova foi modificada de acordo.

De acordo com SambaNova, um sistema de oito processadores baseado em SN40L será capaz de executar e manter um modelo de rede neural de “dimensões” verdadeiramente titânicas – com 5 trilhões de parâmetros e uma profundidade de consulta de mais de 256k. No modelo descrito estamos falando de um conjunto de modelos especialistas tendo o LLM Llama-2 como uma espécie de maestro desta orquestra.

Uma arquitetura com GPUs tradicionais exigiria 24 servidores com 8 aceleradores cada para rodar o mesmo modelo; entretanto, o modelo do acelerador não é especificado.

Como antes, os chips SN40L e nós de computação individuais baseados neles não serão fornecidos a clientes terceiros. A empresa continuará a usar o modelo Dataflow-as-a-Service (DaaS), uma plataforma extensível de serviços de IA por assinatura, que inclui serviços de instalação, comissionamento e gerenciamento de equipamentos como parte do serviço. No entanto, o SN40L aparecerá posteriormente como parte deste serviço e será lançado como parte do serviço de nuvem SambaNova Suite.

avalanche

Próximo A Huawei conseguiu criar núcleos personalizados para o processador Kirin 9000S de 7nm, apesar da pressão das sanções »

Anterior « A NASA mostrou a escuridão eterna do pólo sul da Lua - as pessoas nunca viram este lugar antes

Deixar comentário

Publicado por

avalanche

3 anos atrás

Postagens recentes

Processadores

A Asus é a primeira a restaurar a criptografia de memória desativada nos processadores Ryzen 9000 da AMD.

A Asus começou a distribuir atualizações beta da BIOS que reinstalam o suporte para as…

1 hora atrás

Módulos de RAM, cartões de memória, pen drives, leitores de cartões

As ações das empresas parceiras da Apple na Ásia despencaram após a alta nos preços de Macs e iPads.

Os aumentos de preços de alguns produtos da Apple ontem causaram bastante alvoroço, embora não…

2 horas atrás

Inteligência Artificial, Aprendizado de Máquina, Redes Neurais

Os funcionários da OpenAI começaram a fazer a transição do uso de chatbots para agentes de IA.

Os funcionários da OpenAI começaram a migrar de chatbots para agentes como sua principal forma…

2 horas atrás

Vírus, cavalos de Troia, vulnerabilidades de software, problemas de segurança

O governo Trump pediu à OpenAI que adiasse o lançamento público do GPT-5.6 “por questões de segurança”.

A OpenAI está se preparando para lançar seu novo modelo de IA, o GPT 5.6,…

2 horas atrás

Redes e comunicações

A SpaceX pretende transformar a Starlink em uma operadora de telefonia móvel e desafiar as três maiores empresas dos EUA.

Tecnicamente, os clientes da T-Mobile nos EUA já podem se conectar diretamente aos satélites Starlink…

3 horas atrás

Eletrônica vestível

A Swatch exigiu da Samsung uma indenização de 170 milhões de dólares por copiar o design dos mostradores de seus relógios inteligentes.

Como a prática demonstra, até mesmo o formato de um retângulo com cantos arredondados pode…

3 horas atrás

SambaNova apresentou o processador SN40L AI com memória HBM3, que é muitas vezes mais rápido que os aceleradores GPU

Conteúdo relacionado

Postagens recentes

A Asus é a primeira a restaurar a criptografia de memória desativada nos processadores Ryzen 9000 da AMD.

As ações das empresas parceiras da Apple na Ásia despencaram após a alta nos preços de Macs e iPads.

Os funcionários da OpenAI começaram a fazer a transição do uso de chatbots para agentes de IA.

O governo Trump pediu à OpenAI que adiasse o lançamento público do GPT-5.6 “por questões de segurança”.

A SpaceX pretende transformar a Starlink em uma operadora de telefonia móvel e desafiar as três maiores empresas dos EUA.

A Swatch exigiu da Samsung uma indenização de 170 milhões de dólares por copiar o design dos mostradores de seus relógios inteligentes.