A empresa chinesa Inspur criou o superacelerador Metabrain SD200 para as tarefas de IA que exigem mais recursos. O sistema supostamente pode funcionar com modelos com mais de 1 trilhão de parâmetros.
A plataforma Metabrain SD200 combina 64 placas em um único supernó com memória unificada. Ela se baseia na arquitetura aberta 3D Mesh e em switches Open Fabric proprietários. Em outras palavras, aceleradores baseados em GPU distribuídos em diferentes servidores são unidos por meio de uma interconexão de alta velocidade em um único domínio.
O superacelerador fornece acesso a 4 TB de VRAM e 64 TB de RAM principal. Isso permite a execução simultânea de quatro modelos chineses de IA de código aberto, incluindo DeepSeek R1 e Kimi K2. Além disso, há suporte para colaboração em tempo real entre vários agentes de IA.
Fonte da imagem: Inspur See More
O Metabrain SD200 apresenta baixa latência na transferência de dados, medida em “centenas de nanossegundos”. Em cenários comuns de inferência envolvendo o processamento de pequenos pacotes de dados, o sistema supera soluções comuns do setor em termos de latência.
A nova plataforma inclui ferramentas de otimização. Em particular, a ferramenta Smart Fabric Manager gera automaticamente rotas de dados ideais com base nas características de carga. O Metabrain SD200 é compatível com frameworks populares como PyTorch, vllm e SGLang, possibilitando a migração rápida de modelos e agentes de IA existentes sem a necessidade de reescrever o código do zero. Isso reduz significativamente o custo da migração.
No geral, a tecnologia vGPU remota implementada permite que aceleradores distribuídos em diferentes servidores interajam com a mesma eficácia que se estivessem em um único host. Ao mesmo tempo, o espaço de endereço é oito vezes maior, o que garante a utilização total dos recursos e uma operação eficiente, mesmo ao utilizar modelos de IA com trilhões de parâmetros.
A longa batalha judicial entre o Google e a Epic Games tomou um rumo inesperado.…
A administração do serviço GOG, que luta para preservar os jogos clássicos para as gerações…
"Deus não joga dados", disse Einstein, criticando a agora clássica interpretação de Copenhague (probabilística) da…
Luke Ross, criador de um mod pago de realidade virtual para Cyberpunk 2077 que foi…
Os principais chatbots de IA não conseguiram detectar se os vídeos enviados a eles foram…
Recentemente, circularam inúmeros rumores sobre a série de placas gráficas GeForce RTX 5000, e muitos…