SambaNova apresentou o processador SN40L AI com memória HBM3, que é muitas vezes mais rápido que os aceleradores GPU

O boom em modelos de grandes linguagens inevitavelmente traz ao mercado uma nova classe especializada de processadores – e muitas vezes essas soluções acabam sendo mais eficientes do que a abordagem tradicional de GPU.

A SambaNova Systems, desenvolvedora de tais processadores e sistemas baseados neles, lançou uma nova terceira geração de processadores de IA chamada SN40L.

Fonte das imagens aqui e abaixo: SambaNova via EE Times

No outono de 2022, a empresa lançou o chip SN30 baseado em uma arquitetura única de blocos controlados por programa, mesmo então plenamente consciente da tendência de aumento do volume de dados em redes neurais: o chip recebeu 640 MB de cache SRAM e foi equipado com 1 TB de RAM.

Este desenvolvimento formou a base do mais novo SN40L. Devido à transição da tecnologia de processo de 7 nm da TSMC para o processo mais avançado de 5 nm, os desenvolvedores conseguiram aumentar o número de núcleos para 1.040, mas sua arquitetura permaneceu a mesma. No entanto, tendo em conta a reconfigurabilidade, isto não é uma desvantagem.

A arquitetura de blocos SambaNova consiste em blocos de computação PCU, blocos PMU SRAM, lógica de controle e interconexão de malha

O chip SN40L consiste em dois chips grandes, que respondem por 520 MB de cache SRAM, 1,5 TB de DRAM DDR5 e 64 GB de HBM3 de alta velocidade. Este último foi adicionado ao SN40L como um buffer entre a SRAM ultrarrápida e a DRAM relativamente lenta. Isto deve melhorar o desempenho do chip ao operar no modo de inferência LLM. Para usar o HBM3 de maneira eficaz, a pilha de software SambaNova foi modificada de acordo.

De acordo com SambaNova, um sistema de oito processadores baseado em SN40L será capaz de executar e manter um modelo de rede neural de “dimensões” verdadeiramente titânicas – com 5 trilhões de parâmetros e uma profundidade de consulta de mais de 256k. No modelo descrito estamos falando de um conjunto de modelos especialistas tendo o LLM Llama-2 como uma espécie de maestro desta orquestra.

Uma arquitetura com GPUs tradicionais exigiria 24 servidores com 8 aceleradores cada para rodar o mesmo modelo; entretanto, o modelo do acelerador não é especificado.

Como antes, os chips SN40L e nós de computação individuais baseados neles não serão fornecidos a clientes terceiros. A empresa continuará a usar o modelo Dataflow-as-a-Service (DaaS), uma plataforma extensível de serviços de IA por assinatura, que inclui serviços de instalação, comissionamento e gerenciamento de equipamentos como parte do serviço. No entanto, o SN40L aparecerá posteriormente como parte deste serviço e será lançado como parte do serviço de nuvem SambaNova Suite.

avalanche

Postagens recentes

Apple zomba de smartphones Android por problemas de privacidade em novo anúncio do iPhone

Em seu mais recente anúncio "Privacidade no iPhone", a Apple zombou dos problemas de privacidade…

27 minutos atrás

Strauss Zelnick, CEO da Take-Two Interactive, agora é lutador – o executivo foi adicionado ao WWE 2K26.

A atualização lançada ontem para o simulador de luta livre WWE 2K26, da editora 2K…

27 minutos atrás

Baidu planeja IPO de desenvolvedora de chips de IA avaliada em até US$ 64 bilhões.

Logo no início deste ano, tornou-se público o plano da Baidu de listar sua própria…

57 minutos atrás

Em vez de encerrar o aplicativo de realidade virtual Supernatural, a Meta transformará seu desenvolvimento em uma empresa separada.

A tentativa da Meta✴ de construir um metaverso atraente para um público amplo é amplamente…

57 minutos atrás

As ações da HPE disparam mais de 25% após relatório indicar forte demanda por servidores.

As ações da HPE subiram mais de 25% após a divulgação dos resultados financeiros do…

1 hora atrás