A chinesa Moore Threads apresentou o acelerador MTT S4000 AI – é até 15 vezes mais lento que o NVIDIA H100

A empresa chinesa Moore Threads introduziu um acelerador de computação especializado MTT S4000 em uma GPU proprietária, que fornece desempenho de 200 TOPS (trilhões de operações por segundo) em operações relacionadas à inteligência artificial e grandes modelos de linguagem.

Fonte da imagem: Moore Threads

O MTT S4000 é alimentado por uma GPU baseada na arquitetura MUSA de terceira geração. A empresa não forneceu detalhes sobre a GPU em si. O acelerador é feito em formato de placa de expansão PCIe e está equipado com 48 GB de memória GDDR6 com velocidade de 16 Gbit/s por pino e largura de banda total de 768 GB/s. O MTT S4000 afirma ter suporte para a interface MTLink 1.0, que permite combinar vários aceleradores semelhantes em um sistema. O novo produto possui interface PCIe 5.0. A Moore Threads é a única empresa do mercado que equipa suas placas de vídeo com interface PCIe 5.0.

A empresa afirma que o MTT S4000 oferece desempenho de 25 TFLOPS em operações FP32, 50 TFLOPS em operações TF32, 100 TFLOPS em operações FP16/BF16 e 200 TOPS em operações INT8. Isso é cinco vezes mais do que os mais recentes processadores AMD Ryzen 8040 e Intel Core Ultra, equipados com unidades de processamento neural (NPUs) especializadas projetadas para diversas tarefas de IA. No entanto, está longe de ser os principais aceleradores de IA da NVIDIA e AMD. A versão PCIe do NVIDIA H100 fornece até 51 teraflops em operações FP32, até 756 teraflops em cálculos TF32, 1513 teraflops em operações FP16/BF16 e até 3026 TOPS em INT8.

Uma característica notável do acelerador AI especializado MTT S4000 é que ele está equipado com quatro conectores de vídeo externos. Normalmente, soluções deste nível não possuem tais interfaces. O MTT S4000 pode conectar monitores com suporte a resoluções de até 8K. O acelerador suporta até 96 streams de vídeo com resolução de 1080p e também funciona com as mais recentes ferramentas de desenvolvimento USIFY que podem aproveitar ao máximo o software baseado em CUDA da NVIDIA.

Moore Threads observou na apresentação que o MTT S4000 será oferecido, entre outras coisas, como parte dos sistemas de computação de servidores KUAE, semelhantes aos sistemas NVIDIA DGX. Um servidor KUAE MCCX D800 contém oito aceleradores MTT S4000. A plataforma oferece maior escalabilidade ao permitir que vários desses servidores sejam combinados em clusters únicos. Os aceleradores Moore Threads MTT S4000 e os sistemas KUAE baseados neles suportam todos os modelos modernos de linguagem grande (LLM), incluindo Llama, GLM, Aquila, Baichuan, GPT, Bloom, Yuyan, e são capazes de lidar com LLMs com até 130 bilhões de parâmetros diferentes .

O fabricante não informou nada sobre o custo do MTT S4000. Sabe-se que o primeiro lote de milhares desses aceleradores será usado para criar o primeiro cluster de computação em grande escala da China para tarefas relacionadas à IA.

avalanche

Postagens recentes

IBM adquiriu duas plataformas em nuvem da Software AG por 2,13 bilhões de euros

A IBM Corporation anunciou um acordo para adquirir as plataformas StreamSets e webMethods da empresa…

19 minutos atrás

GOST na área de data centers foi cancelado um ano e meio após a adoção

A Agência Federal de Regulamentação Técnica e Metrologia (Rosstandart) cancelou GOST R 70139-2022 “Centros de…

30 minutos atrás

Os cientistas criaram biorobôs a partir de células humanas – eles se movem pelos cílios

Algum dia, os nanorrobôs serão usados ​​para tratar uma pessoa de dentro para fora. Eles…

44 minutos atrás

Um dos últimos designers da era Jony Ive deixou a Apple

Peter Russell-Clarke, um dos últimos designers industriais líderes da Apple da era Jony Ive, deixou…

60 minutos atrás

NASA lançará balão sobre a Antártica para estudar a Via Láctea e outras galáxias

A NASA está se preparando para lançar o projeto experimental GUSTO (Galactic/Extragalactic ULDB Spectroscopic Terahertz…

1 hora atrás