A Enflame da China lançou um novo acelerador de IA Cloudblazer Yunsui i20

A Enflame, que neste verão apresentou aceleradores baseados na segunda geração de seus chips DTU AI, lançou um novo acelerador de inferência Cloudblazer Yunsui i20 com um chip Suixi 2.5. É fabricado utilizando o processo FinFET 12nm da GlobalFoundries e possui uma arquitetura de alto desempenho atualizada de núcleos computacionais GCU-CARE 2.0, graças aos quais, segundo os criadores, foi possível atingir uma eficiência comparável ao GPU 7nm convencional.

Entre as principais características do novo produto, as notas da empresa o aumento do poder de computação, a capacidade de executar tensor, vetor e cálculos escalares, API para C ++ e Python, bem como suporte para as principais estruturas e formatos de modelo (TensorFlow, PyTorch , ONNX). O software incluído oferece opções de migração flexível com suporte para virtualização tecnologias, bem como multi-usuário e multitarefa ambientes com isolamento do processo seguro.

O Yunsui i20 possui 16 GB de memória HBM2e com largura de banda de até 819 GB / s. O novo produto suporta todos os formatos principais e fornece uma plataforma de inferência universal, inclusive para as nuvens. O desempenho de FP32 de computação de pico atinge 32 Teraflops, TF32 (não é especificado se for sobre compatibilidade com NVIDIA) – 128 Teraflops, FP16 / BF16 – 128 Teraflops e INT8 atinge 256 Tops. Comparado com a primeira geração de produtos, o Yunsui i20 aumentou o desempenho do FP em 1,8 vezes e a computação INT em 3,6 vezes.

Para comparação – a versão PCIe dos cálculos de desempenho NVIDIA A100 FP32, TF32, FP16 / BF16 e INT8 19,5, 156, 312 e 624 teraflops (Tops para INT) e a quantidade de largura de banda de memória e são 40/80 GB 1555/1935 GB / I s, respectivamente. Em AMD MI100 memória HBM2-capacidade é de 32 GB (1,23 Tb / s) e desempenho FP32, FP16 e BF16 igual a 46,1, 92,3 e 184,6, respectivamente Tflops. Todos os três têm um acelerador de interface PCIe 4.0.

Otimização da pilha de software TopsRider proprietária fez uma contribuição significativa para melhorar o desempenho, devido a que a carga no subsistema de memória foi reduzido. Como resultado, o desempenho médio de execução do modelo aumentou 3,5 vezes, ea eficiência de utilização de capacidade de computação – em média, 2 vezes. Além disso, as novas tecnologias modelo de programação e automação pode acelerar a eficiência de desenvolvimento e reduzir o custo da migração do modelo. A empresa está convencido de que tudo isso vai fazer a Yunsui i20 uma solução mais competitiva.

Graças à tecnologia de virtualização, o Yunsui i20 pode ser dividido em 6 domínios independentes isolados uns dos outros – anteriormente oferecido apenas pela NVIDIA. Junto com outros produtos que também são totalmente migrados para a próxima geração de aceleradores de IA, a Enflame espera ganhar participação de mercado significativa em setores inovadores, como cidades inteligentes e governo digital, bem como em indústrias tradicionais, como finanças, transporte e energia, onde serão necessárias tecnologias mais avançadas Soluções de IA.

avalanche

Postagens recentes

Ações da Virgin Orbit despencaram após queda de foguete na Europa

«O primeiro lançamento espacial do território da Europa "não teve sucesso - a empresa Virgin…

1 hora atrás