A SambaNova Systems, uma startup de IA fundada em 2017 por ex-alunos da Sun, Oracle e Stanford, anunciou o sistema de implantação DeepSeek-R1 671B mais rápido do mundo. Para equipamentos Nvidia, tais indicadores não estão disponíveis.

Fonte da imagem: sambanova.ai

O SambaNova atingiu o desempenho DeepSeek-R1 de 198 tokens por segundo em apenas 16 aceleradores personalizados, um feito que exigiria a implantação de 40 racks de 320 GPUs Nvidia. “O SambaNova em chips SN40L RDU se tornou a plataforma mais rápida para executar o DeepSeek. “Este é um aumento de cinco vezes na velocidade da GPU mais recente em um único rack e, até o final do ano, ofereceremos 100 vezes a capacidade do DeepSeek-R1”, prometeu o cofundador e CEO da SambaNova, Rodrigo Liang.

Cargas de trabalho de IA que exigem muitos recursos tradicionalmente são alimentadas por GPUs Nvidia, mas a SambaNova diz que sua arquitetura de fluxo de dados configurável é uma solução mais eficiente. Seu hardware roda três vezes mais rápido e consome cinco vezes menos energia do que as GPUs modernas mais potentes, mantendo todo o poder de computação do modelo DeepSeek-R1. A conquista foi confirmada por especialistas da Artificial Analysis, empresa que realiza avaliações independentes de sistemas de IA.

O modelo DeepSeek-R1 671B de código aberto está disponível na nuvem SambaNova via API. A empresa está aumentando ativamente sua capacidade e espera atingir uma taxa de transferência total de 20.000 tokens por segundo em um futuro próximo.

avalanche

Postagens recentes

Outra GeForce RTX 5090 sofreu danos significativos depois que um conector de alimentação 12V-2×6 pegou fogo.

Um usuário do Reddit relatou um incêndio em um conector de alimentação 12V-2x6 de 12+4…

46 minutos atrás

Há 50 anos, a inteligência artificial derrotou o campeão soviético de xadrez pela primeira vez.

Em 1975, uma aposta curiosa foi feita na URSS entre cientistas do Instituto de Ciências…

7 horas atrás

Há 50 anos, a inteligência artificial derrotou o campeão soviético de xadrez pela primeira vez.

Em 1975, uma aposta curiosa foi feita na URSS entre cientistas do Instituto de Ciências…

7 horas atrás

Médico do Ritmo – No Ritmo do Coração. Resenha

Processador Intel Core 2 Duo E4600 2.4 GHz / AMD Athlon 64 X2 4600 2.4…

7 horas atrás

A Intel montou um chip de IA gigante a partir de 16 núcleos de computação e 24 módulos HBM5.

A Intel foi a primeira a desenvolver uma arquitetura de chiplets claramente desagregada — as…

8 horas atrás

O chefe da Battlestate Games esclareceu que Escape from Tarkov não foi criado para diversão e entretenimento.

A maioria dos videogames é projetada para proporcionar diversão e entretenimento, mas o jogo de…

9 horas atrás