A SambaNova Systems, uma startup de IA fundada em 2017 por ex-alunos da Sun, Oracle e Stanford, anunciou o sistema de implantação DeepSeek-R1 671B mais rápido do mundo. Para equipamentos Nvidia, tais indicadores não estão disponíveis.
Fonte da imagem: sambanova.ai
O SambaNova atingiu o desempenho DeepSeek-R1 de 198 tokens por segundo em apenas 16 aceleradores personalizados, um feito que exigiria a implantação de 40 racks de 320 GPUs Nvidia. “O SambaNova em chips SN40L RDU se tornou a plataforma mais rápida para executar o DeepSeek. “Este é um aumento de cinco vezes na velocidade da GPU mais recente em um único rack e, até o final do ano, ofereceremos 100 vezes a capacidade do DeepSeek-R1”, prometeu o cofundador e CEO da SambaNova, Rodrigo Liang.
Cargas de trabalho de IA que exigem muitos recursos tradicionalmente são alimentadas por GPUs Nvidia, mas a SambaNova diz que sua arquitetura de fluxo de dados configurável é uma solução mais eficiente. Seu hardware roda três vezes mais rápido e consome cinco vezes menos energia do que as GPUs modernas mais potentes, mantendo todo o poder de computação do modelo DeepSeek-R1. A conquista foi confirmada por especialistas da Artificial Analysis, empresa que realiza avaliações independentes de sistemas de IA.
O modelo DeepSeek-R1 671B de código aberto está disponível na nuvem SambaNova via API. A empresa está aumentando ativamente sua capacidade e espera atingir uma taxa de transferência total de 20.000 tokens por segundo em um futuro próximo.
Amanhã, a Apple realizará uma apresentação para apresentar novos produtos ao público em geral, incluindo…
Desde o final de 2022, a gigante chinesa CATL mantém uma fábrica de baterias de…
No mês passado, a Microsoft lançou outro patch de segurança para o Windows 11 e,…
A Intel continua a desenvolver sua ferramenta proprietária de otimização de desempenho para jogos, o…
A empresa holandesa ASML é a maior fornecedora de scanners litográficos do mundo e lucra…
A startup Figure atualizou seu modelo de IA Helix Vision Language Action (VLA), dando ao…