A Enflame, que neste verão apresentou aceleradores baseados na segunda geração de seus chips DTU AI, lançou um novo acelerador de inferência Cloudblazer Yunsui i20 com um chip Suixi 2.5. É fabricado utilizando o processo FinFET 12nm da GlobalFoundries e possui uma arquitetura de alto desempenho atualizada de núcleos computacionais GCU-CARE 2.0, graças aos quais, segundo os criadores, foi possível atingir uma eficiência comparável ao GPU 7nm convencional.
Entre as principais características do novo produto, as notas da empresa o aumento do poder de computação, a capacidade de executar tensor, vetor e cálculos escalares, API para C ++ e Python, bem como suporte para as principais estruturas e formatos de modelo (TensorFlow, PyTorch , ONNX). O software incluído oferece opções de migração flexível com suporte para virtualização tecnologias, bem como multi-usuário e multitarefa ambientes com isolamento do processo seguro.
O Yunsui i20 possui 16 GB de memória HBM2e com largura de banda de até 819 GB / s. O novo produto suporta todos os formatos principais e fornece uma plataforma de inferência universal, inclusive para as nuvens. O desempenho de FP32 de computação de pico atinge 32 Teraflops, TF32 (não é especificado se for sobre compatibilidade com NVIDIA) – 128 Teraflops, FP16 / BF16 – 128 Teraflops e INT8 atinge 256 Tops. Comparado com a primeira geração de produtos, o Yunsui i20 aumentou o desempenho do FP em 1,8 vezes e a computação INT em 3,6 vezes.
Para comparação – a versão PCIe dos cálculos de desempenho NVIDIA A100 FP32, TF32, FP16 / BF16 e INT8 19,5, 156, 312 e 624 teraflops (Tops para INT) e a quantidade de largura de banda de memória e são 40/80 GB 1555/1935 GB / I s, respectivamente. Em AMD MI100 memória HBM2-capacidade é de 32 GB (1,23 Tb / s) e desempenho FP32, FP16 e BF16 igual a 46,1, 92,3 e 184,6, respectivamente Tflops. Todos os três têm um acelerador de interface PCIe 4.0.
Otimização da pilha de software TopsRider proprietária fez uma contribuição significativa para melhorar o desempenho, devido a que a carga no subsistema de memória foi reduzido. Como resultado, o desempenho médio de execução do modelo aumentou 3,5 vezes, ea eficiência de utilização de capacidade de computação – em média, 2 vezes. Além disso, as novas tecnologias modelo de programação e automação pode acelerar a eficiência de desenvolvimento e reduzir o custo da migração do modelo. A empresa está convencido de que tudo isso vai fazer a Yunsui i20 uma solução mais competitiva.
Graças à tecnologia de virtualização, o Yunsui i20 pode ser dividido em 6 domínios independentes isolados uns dos outros – anteriormente oferecido apenas pela NVIDIA. Junto com outros produtos que também são totalmente migrados para a próxima geração de aceleradores de IA, a Enflame espera ganhar participação de mercado significativa em setores inovadores, como cidades inteligentes e governo digital, bem como em indústrias tradicionais, como finanças, transporte e energia, onde serão necessárias tecnologias mais avançadas Soluções de IA.
Os jornalistas da Laptop Mag testaram o traje háptico OWO Skin na CES 2023, que…
Desde 2016, a National Highway Traffic Safety Administration (NHTSA) iniciou mais de 36 investigações de…
«O primeiro lançamento espacial do território da Europa "não teve sucesso - a empresa Virgin…
A Apple começou a desenvolver seu próprio modem móvel em 2018, antes de comprar o…
A BMW fará o recall de mais de 14.000 veículos elétricos devido a uma falha…
Na semana passada, em 4 de janeiro de 2023, faleceu o fundador e CEO da…