Inspur revela o superacelerador Metabrain SD200 para modelos de IA de trilhões de parâmetros

A empresa chinesa Inspur criou o superacelerador Metabrain SD200 para as tarefas de IA que exigem mais recursos. O sistema supostamente pode funcionar com modelos com mais de 1 trilhão de parâmetros.

A plataforma Metabrain SD200 combina 64 placas em um único supernó com memória unificada. Ela se baseia na arquitetura aberta 3D Mesh e em switches Open Fabric proprietários. Em outras palavras, aceleradores baseados em GPU distribuídos em diferentes servidores são unidos por meio de uma interconexão de alta velocidade em um único domínio.

O superacelerador fornece acesso a 4 TB de VRAM e 64 TB de RAM principal. Isso permite a execução simultânea de quatro modelos chineses de IA de código aberto, incluindo DeepSeek R1 e Kimi K2. Além disso, há suporte para colaboração em tempo real entre vários agentes de IA.

Fonte da imagem: Inspur See More

O Metabrain SD200 apresenta baixa latência na transferência de dados, medida em “centenas de nanossegundos”. Em cenários comuns de inferência envolvendo o processamento de pequenos pacotes de dados, o sistema supera soluções comuns do setor em termos de latência.

A nova plataforma inclui ferramentas de otimização. Em particular, a ferramenta Smart Fabric Manager gera automaticamente rotas de dados ideais com base nas características de carga. O Metabrain SD200 é compatível com frameworks populares como PyTorch, vllm e SGLang, possibilitando a migração rápida de modelos e agentes de IA existentes sem a necessidade de reescrever o código do zero. Isso reduz significativamente o custo da migração.

No geral, a tecnologia vGPU remota implementada permite que aceleradores distribuídos em diferentes servidores interajam com a mesma eficácia que se estivessem em um único host. Ao mesmo tempo, o espaço de endereço é oito vezes maior, o que garante a utilização total dos recursos e uma operação eficiente, mesmo ao utilizar modelos de IA com trilhões de parâmetros.

admin

Postagens recentes

A placa de vídeo Radeon 9070 GRE com 12 GB de memória chegará ao mercado global por um preço de US$ 549.

De acordo com o VideoCardz, a AMD lançará a placa de vídeo Radeon 9070 GRE…

3 horas atrás

A Intel apresentará uma nova versão do padrão de alimentação ATX12VO V3 para fontes de alimentação e placas-mãe.

A Intel está prestes a apresentar a terceira versão do seu padrão de alimentação ATX12VO…

7 horas atrás

Lego Batman: Legacy of the Dark Knight é o novo Batman: Arkham? Análise / Jogos

Jogado no PlayStation 5 Houve uma época em que vários jogos Lego eram lançados todos…

7 horas atrás

Lego Batman: Legacy of the Dark Knight é o novo Batman: Arkham? Análise

Jogado no PlayStation 5 Houve uma época em que vários jogos Lego eram lançados todos…

8 horas atrás

O jogo de RPG tático RuneSmith permite que você lidere um esquadrão de anões para extorquir uma dívida do vilão principal.

Os desenvolvedores do estúdio Terahard anunciaram RuneSmith, um RPG tático no qual um esquadrão de…

11 horas atrás