Aceleradores de IA especializados não são surpresa agora. As versões projetadas para treinar modelos já alcançaram complexidade e consumo de energia com GPUs modernas, mas os chips usados para executar modelos treinados nem sempre são simples.
A Neuchips fez o contrário com o anúncio do RecAccel N3000 ASIC, que apresenta eficiência aprimorada e geração de calor reduzida em um alto nível de desempenho. Isso o tornará adequado para plataformas de computação de borda “inteligentes” que geralmente são forçadas a operar dentro de restrições térmicas e de energia rígidas. Neste caso, estamos falando de sistemas de inferência compactos, mas poderosos.
O novo produto é feito usando a tecnologia de processo de 7 nm da TSMC e foi originalmente projetado para executar modelos de recomendação de aprendizado profundo (DLRM). Durante o segundo semestre, a empresa pretende lançar no mercado módulos OCP para servidores, em dois formatos ao mesmo tempo: dual M.2 e na forma de placa de expansão com interface PCI Express 5.0.
A empresa testou totalmente o RecAccel N3000 no MLPerf e está confiante no sucesso do novo produto. O acelerador usa algoritmos proprietários de quantização e calibração de 8 bits que garantem uma precisão de 99,95% do FP32, o sistema de cache integrado reduzirá o tráfego para a memória externa LPDDR5 em 50% e a eficiência do uso da largura de banda da memória, pelo contrário , aumentará em 30%.
A arquitetura projetada pela Neuchips alcança eficiência energética na região de 1µJ por resultado, permitindo que os desenvolvedores afirmem que a nova plataforma ASIC tem um desempenho melhor do que as inferências planejadas anteriormente de 20M por segundo a 20W. No momento, é bastante difícil avaliar esse indicador em comparação com as soluções existentes, pois podemos falar de diferentes modelos e cenários para sua aplicação.
Observe que esses aceleradores já existiam em 2020. O que se sabe agora é que o RecAccel N3000 receberá RoT de hardware e suportará todos os modelos populares de recomendação de IA, incluindo DLRM, WND, DCN e NCF. No entanto, há motivos para acreditar que tudo isso não são promessas vazias, já que a empresa foi criada pelo ex-chefe da Global Unichip Corporation, subsidiária da TSMC, que desenvolve ASICs e blocos IP personalizados.