Inspur revela o superacelerador Metabrain SD200 para modelos de IA de trilhões de parâmetros

A empresa chinesa Inspur criou o superacelerador Metabrain SD200 para as tarefas de IA que exigem mais recursos. O sistema supostamente pode funcionar com modelos com mais de 1 trilhão de parâmetros.

A plataforma Metabrain SD200 combina 64 placas em um único supernó com memória unificada. Ela se baseia na arquitetura aberta 3D Mesh e em switches Open Fabric proprietários. Em outras palavras, aceleradores baseados em GPU distribuídos em diferentes servidores são unidos por meio de uma interconexão de alta velocidade em um único domínio.

O superacelerador fornece acesso a 4 TB de VRAM e 64 TB de RAM principal. Isso permite a execução simultânea de quatro modelos chineses de IA de código aberto, incluindo DeepSeek R1 e Kimi K2. Além disso, há suporte para colaboração em tempo real entre vários agentes de IA.

Fonte da imagem: Inspur See More

O Metabrain SD200 apresenta baixa latência na transferência de dados, medida em “centenas de nanossegundos”. Em cenários comuns de inferência envolvendo o processamento de pequenos pacotes de dados, o sistema supera soluções comuns do setor em termos de latência.

A nova plataforma inclui ferramentas de otimização. Em particular, a ferramenta Smart Fabric Manager gera automaticamente rotas de dados ideais com base nas características de carga. O Metabrain SD200 é compatível com frameworks populares como PyTorch, vllm e SGLang, possibilitando a migração rápida de modelos e agentes de IA existentes sem a necessidade de reescrever o código do zero. Isso reduz significativamente o custo da migração.

No geral, a tecnologia vGPU remota implementada permite que aceleradores distribuídos em diferentes servidores interajam com a mesma eficácia que se estivessem em um único host. Ao mesmo tempo, o espaço de endereço é oito vezes maior, o que garante a utilização total dos recursos e uma operação eficiente, mesmo ao utilizar modelos de IA com trilhões de parâmetros.

admin

Postagens recentes

Torre de Notícias – Últimas Notícias! Análise / Jogos

Intel Core i3-6100 3.7 GHz / AMD FX-4350 4.2 GHz, 8 GB de RAM, placa…

21 minutos atrás

Torre de Notícias – Notícias de Última Hora! Análise

Intel Core i3-6100 3.7 GHz / AMD FX-4350 4.2 GHz, 8 GB de RAM, placa…

21 minutos atrás

A Xiaomi inaugurou uma fábrica gigantesca e totalmente automatizada de eletrodomésticos inteligentes em Wuhan.

Durante a apresentação do smartphone Xiaomi 17 Ultra em 25 de dezembro de 2025, a…

31 minutos atrás

Hackers invadiram o Rainbow Six Siege e organizaram um sorteio gratuito — a Ubisoft desligou os servidores do jogo.

O popular jogo de tiro tático online Tom Clancy's Rainbow Six Siege, da desenvolvedora e…

3 horas atrás

Na China, foi identificado o melhor carro elétrico para dirigir em clima frio – a Tesla ficou apenas em quarto lugar.

O maior teste de inverno de veículos elétricos realizado na China oferece uma nova perspectiva…

4 horas atrás

Uma placa de vídeo por mão: o Japão começou a restringir as vendas das GeForce RTX 5000 e Radeon RX 9000 devido à escassez de memória.

A escassez global de memória RAM e flash está se agravando constantemente, afetando setores que…

4 horas atrás