Inspur revela o superacelerador Metabrain SD200 para modelos de IA de trilhões de parâmetros

A empresa chinesa Inspur criou o superacelerador Metabrain SD200 para as tarefas de IA que exigem mais recursos. O sistema supostamente pode funcionar com modelos com mais de 1 trilhão de parâmetros.

A plataforma Metabrain SD200 combina 64 placas em um único supernó com memória unificada. Ela se baseia na arquitetura aberta 3D Mesh e em switches Open Fabric proprietários. Em outras palavras, aceleradores baseados em GPU distribuídos em diferentes servidores são unidos por meio de uma interconexão de alta velocidade em um único domínio.

O superacelerador fornece acesso a 4 TB de VRAM e 64 TB de RAM principal. Isso permite a execução simultânea de quatro modelos chineses de IA de código aberto, incluindo DeepSeek R1 e Kimi K2. Além disso, há suporte para colaboração em tempo real entre vários agentes de IA.

Fonte da imagem: Inspur See More

O Metabrain SD200 apresenta baixa latência na transferência de dados, medida em “centenas de nanossegundos”. Em cenários comuns de inferência envolvendo o processamento de pequenos pacotes de dados, o sistema supera soluções comuns do setor em termos de latência.

A nova plataforma inclui ferramentas de otimização. Em particular, a ferramenta Smart Fabric Manager gera automaticamente rotas de dados ideais com base nas características de carga. O Metabrain SD200 é compatível com frameworks populares como PyTorch, vllm e SGLang, possibilitando a migração rápida de modelos e agentes de IA existentes sem a necessidade de reescrever o código do zero. Isso reduz significativamente o custo da migração.

No geral, a tecnologia vGPU remota implementada permite que aceleradores distribuídos em diferentes servidores interajam com a mesma eficácia que se estivessem em um único host. Ao mesmo tempo, o espaço de endereço é oito vezes maior, o que garante a utilização total dos recursos e uma operação eficiente, mesmo ao utilizar modelos de IA com trilhões de parâmetros.

admin

Postagens recentes

A TSMC iniciou o recrutamento para sua fábrica de chips na Europa.

Os planos da TSMC, de Taiwan, para expandir a produção em seu país de origem…

1 hora atrás

A BYD espera alcançar zero acidentes com seu piloto automático proprietário e compensará os danos em acidentes que envolvam o sistema.

Na semana passada, a gigante automotiva chinesa BYD apresentou um novo chip de 4 nanômetros…

2 horas atrás

A placa de vídeo Radeon 9070 GRE com 12 GB de memória chegará ao mercado global por um preço de US$ 549.

De acordo com o VideoCardz, a AMD lançará a placa de vídeo Radeon 9070 GRE…

5 horas atrás

A Intel apresentará uma nova versão do padrão de alimentação ATX12VO V3 para fontes de alimentação e placas-mãe.

A Intel está prestes a apresentar a terceira versão do seu padrão de alimentação ATX12VO…

9 horas atrás

Lego Batman: Legacy of the Dark Knight é o novo Batman: Arkham? Análise / Jogos

Jogado no PlayStation 5 Houve uma época em que vários jogos Lego eram lançados todos…

9 horas atrás