Aceleradores de IA especializados não são surpresa agora. As versões projetadas para treinar modelos já alcançaram complexidade e consumo de energia com GPUs modernas, mas os chips usados para executar modelos treinados nem sempre são simples.
A Neuchips fez o contrário com o anúncio do RecAccel N3000 ASIC, que apresenta eficiência aprimorada e geração de calor reduzida em um alto nível de desempenho. Isso o tornará adequado para plataformas de computação de borda “inteligentes” que geralmente são forçadas a operar dentro de restrições térmicas e de energia rígidas. Neste caso, estamos falando de sistemas de inferência compactos, mas poderosos.
O novo produto é feito usando a tecnologia de processo de 7 nm da TSMC e foi originalmente projetado para executar modelos de recomendação de aprendizado profundo (DLRM). Durante o segundo semestre, a empresa pretende lançar no mercado módulos OCP para servidores, em dois formatos ao mesmo tempo: dual M.2 e na forma de placa de expansão com interface PCI Express 5.0.
Fonte: Neuchips
A empresa testou totalmente o RecAccel N3000 no MLPerf e está confiante no sucesso do novo produto. O acelerador usa algoritmos proprietários de quantização e calibração de 8 bits que garantem uma precisão de 99,95% do FP32, o sistema de cache integrado reduzirá o tráfego para a memória externa LPDDR5 em 50% e a eficiência do uso da largura de banda da memória, pelo contrário , aumentará em 30%.
A arquitetura projetada pela Neuchips alcança eficiência energética na região de 1µJ por resultado, permitindo que os desenvolvedores afirmem que a nova plataforma ASIC tem um desempenho melhor do que as inferências planejadas anteriormente de 20M por segundo a 20W. No momento, é bastante difícil avaliar esse indicador em comparação com as soluções existentes, pois podemos falar de diferentes modelos e cenários para sua aplicação.
Observe que esses aceleradores já existiam em 2020. O que se sabe agora é que o RecAccel N3000 receberá RoT de hardware e suportará todos os modelos populares de recomendação de IA, incluindo DLRM, WND, DCN e NCF. No entanto, há motivos para acreditar que tudo isso não são promessas vazias, já que a empresa foi criada pelo ex-chefe da Global Unichip Corporation, subsidiária da TSMC, que desenvolve ASICs e blocos IP personalizados.
Os usuários finais dos principais serviços de informação há muito tempo fornecem às empresas de…
Até agora, as discussões sobre o acordo para a cisão dos negócios americanos do TikTok…
Na Alemanha, durante uma transmissão ao vivo da pista de testes da Automotive Testing Papenburg,…
Um entusiasta instalou com sucesso uma placa de vídeo Radeon RX 9070 com o BIOS…
Rumores sobre um MacBook com tela sensível ao toque continuam circulando e, graças a mais…
Um ataque cibernético a um fornecedor de software aeroportuário causou interrupções generalizadas e cancelamentos de…