Inspur revela o superacelerador Metabrain SD200 para modelos de IA de trilhões de parâmetros

A empresa chinesa Inspur criou o superacelerador Metabrain SD200 para as tarefas de IA que exigem mais recursos. O sistema supostamente pode funcionar com modelos com mais de 1 trilhão de parâmetros.

A plataforma Metabrain SD200 combina 64 placas em um único supernó com memória unificada. Ela se baseia na arquitetura aberta 3D Mesh e em switches Open Fabric proprietários. Em outras palavras, aceleradores baseados em GPU distribuídos em diferentes servidores são unidos por meio de uma interconexão de alta velocidade em um único domínio.

O superacelerador fornece acesso a 4 TB de VRAM e 64 TB de RAM principal. Isso permite a execução simultânea de quatro modelos chineses de IA de código aberto, incluindo DeepSeek R1 e Kimi K2. Além disso, há suporte para colaboração em tempo real entre vários agentes de IA.

Fonte da imagem: Inspur See More

O Metabrain SD200 apresenta baixa latência na transferência de dados, medida em “centenas de nanossegundos”. Em cenários comuns de inferência envolvendo o processamento de pequenos pacotes de dados, o sistema supera soluções comuns do setor em termos de latência.

A nova plataforma inclui ferramentas de otimização. Em particular, a ferramenta Smart Fabric Manager gera automaticamente rotas de dados ideais com base nas características de carga. O Metabrain SD200 é compatível com frameworks populares como PyTorch, vllm e SGLang, possibilitando a migração rápida de modelos e agentes de IA existentes sem a necessidade de reescrever o código do zero. Isso reduz significativamente o custo da migração.

No geral, a tecnologia vGPU remota implementada permite que aceleradores distribuídos em diferentes servidores interajam com a mesma eficácia que se estivessem em um único host. Ao mesmo tempo, o espaço de endereço é oito vezes maior, o que garante a utilização total dos recursos e uma operação eficiente, mesmo ao utilizar modelos de IA com trilhões de parâmetros.

admin

Postagens recentes

O Google vinculou o reCAPTCHA aos Serviços do Google Play, interrompendo a verificação para usuários do Android que não possuem os serviços do Google.

O Google integrou o sistema de verificação reCAPTCHA de última geração à plataforma fechada Google…

3 horas atrás

A Samsung expande sua equipe de robótica humanoide e acelera a transformação da IA.

A Samsung Electronics expandiu sua equipe de robótica do futuro e, simultaneamente, sua divisão de…

3 horas atrás

A Nvidia gastou mais de 40 bilhões de dólares na aquisição de ativos de outras empresas este ano.

Com receitas recordes em meio ao boom da IA, a Nvidia tem investido muito mais…

7 horas atrás

Foram revelados detalhes sobre os próximos processadores da Intel: Nova Lake, Razor Lake, Titan Lake e Moon Lake, que serão lançados antes de 2028.

A Intel planeja apresentar seus processadores Nova Lake no segundo semestre deste ano. Embora muito…

8 horas atrás

Sob a liderança de Lip-Bu Tan, a Intel nunca conseguiu se livrar de seus problemas centrais.

O impressionante desempenho das ações da Intel este ano pode dar a impressão de que…

14 horas atrás