Inspur revela o superacelerador Metabrain SD200 para modelos de IA de trilhões de parâmetros

A empresa chinesa Inspur criou o superacelerador Metabrain SD200 para as tarefas de IA que exigem mais recursos. O sistema supostamente pode funcionar com modelos com mais de 1 trilhão de parâmetros.

A plataforma Metabrain SD200 combina 64 placas em um único supernó com memória unificada. Ela se baseia na arquitetura aberta 3D Mesh e em switches Open Fabric proprietários. Em outras palavras, aceleradores baseados em GPU distribuídos em diferentes servidores são unidos por meio de uma interconexão de alta velocidade em um único domínio.

O superacelerador fornece acesso a 4 TB de VRAM e 64 TB de RAM principal. Isso permite a execução simultânea de quatro modelos chineses de IA de código aberto, incluindo DeepSeek R1 e Kimi K2. Além disso, há suporte para colaboração em tempo real entre vários agentes de IA.

Fonte da imagem: Inspur See More

O Metabrain SD200 apresenta baixa latência na transferência de dados, medida em “centenas de nanossegundos”. Em cenários comuns de inferência envolvendo o processamento de pequenos pacotes de dados, o sistema supera soluções comuns do setor em termos de latência.

A nova plataforma inclui ferramentas de otimização. Em particular, a ferramenta Smart Fabric Manager gera automaticamente rotas de dados ideais com base nas características de carga. O Metabrain SD200 é compatível com frameworks populares como PyTorch, vllm e SGLang, possibilitando a migração rápida de modelos e agentes de IA existentes sem a necessidade de reescrever o código do zero. Isso reduz significativamente o custo da migração.

No geral, a tecnologia vGPU remota implementada permite que aceleradores distribuídos em diferentes servidores interajam com a mesma eficácia que se estivessem em um único host. Ao mesmo tempo, o espaço de endereço é oito vezes maior, o que garante a utilização total dos recursos e uma operação eficiente, mesmo ao utilizar modelos de IA com trilhões de parâmetros.

admin

Postagens recentes

“Viva o Príncipe!”: Em resposta ao cancelamento do remake, o GOG salvará o clássico Prince of Persia: The Sands of Time do esquecimento digital.

A administração do serviço GOG, que luta para preservar os jogos clássicos para as gerações…

1 hora atrás

Na China, eles descobriram como enganar o Universo e acender um “sol artificial” na Terra de forma barata.

"Deus não joga dados", disse Einstein, criticando a agora clássica interpretação de Copenhague (probabilística) da…

1 hora atrás

O criador de Cyberpunk 2077 VR recebeu mais uma denúncia de violação de direitos autorais e teve o acesso a todos os mods pagos bloqueado.

Luke Ross, criador de um mod pago de realidade virtual para Cyberpunk 2077 que foi…

3 horas atrás

A IA engana a si mesma: ChatGPT, Gemini e Grok falham no teste de reconhecimento de vídeo de Sora.

Os principais chatbots de IA não conseguiram detectar se os vídeos enviados a eles foram…

3 horas atrás

Os preços de venda recomendados são coisa do passado: um blogueiro descobriu que a Nvidia cancelou os descontos para parceiros.

Recentemente, circularam inúmeros rumores sobre a série de placas gráficas GeForce RTX 5000, e muitos…

3 horas atrás