Aceleradores de IA especializados não são surpresa agora. As versões projetadas para treinar modelos já alcançaram complexidade e consumo de energia com GPUs modernas, mas os chips usados para executar modelos treinados nem sempre são simples.
A Neuchips fez o contrário com o anúncio do RecAccel N3000 ASIC, que apresenta eficiência aprimorada e geração de calor reduzida em um alto nível de desempenho. Isso o tornará adequado para plataformas de computação de borda “inteligentes” que geralmente são forçadas a operar dentro de restrições térmicas e de energia rígidas. Neste caso, estamos falando de sistemas de inferência compactos, mas poderosos.
O novo produto é feito usando a tecnologia de processo de 7 nm da TSMC e foi originalmente projetado para executar modelos de recomendação de aprendizado profundo (DLRM). Durante o segundo semestre, a empresa pretende lançar no mercado módulos OCP para servidores, em dois formatos ao mesmo tempo: dual M.2 e na forma de placa de expansão com interface PCI Express 5.0.
Fonte: Neuchips
A empresa testou totalmente o RecAccel N3000 no MLPerf e está confiante no sucesso do novo produto. O acelerador usa algoritmos proprietários de quantização e calibração de 8 bits que garantem uma precisão de 99,95% do FP32, o sistema de cache integrado reduzirá o tráfego para a memória externa LPDDR5 em 50% e a eficiência do uso da largura de banda da memória, pelo contrário , aumentará em 30%.
A arquitetura projetada pela Neuchips alcança eficiência energética na região de 1µJ por resultado, permitindo que os desenvolvedores afirmem que a nova plataforma ASIC tem um desempenho melhor do que as inferências planejadas anteriormente de 20M por segundo a 20W. No momento, é bastante difícil avaliar esse indicador em comparação com as soluções existentes, pois podemos falar de diferentes modelos e cenários para sua aplicação.
Observe que esses aceleradores já existiam em 2020. O que se sabe agora é que o RecAccel N3000 receberá RoT de hardware e suportará todos os modelos populares de recomendação de IA, incluindo DLRM, WND, DCN e NCF. No entanto, há motivos para acreditar que tudo isso não são promessas vazias, já que a empresa foi criada pelo ex-chefe da Global Unichip Corporation, subsidiária da TSMC, que desenvolve ASICs e blocos IP personalizados.
A fotônica, como nossos leitores habituais provavelmente já sabem, é uma área extremamente promissora de…
Hoje, na abertura da conferência Google Cloud Next '26, o CEO do Google Cloud, Thomas…
A Microsoft anunciou uma nova parceria envolvendo sua divisão Xbox apenas um dia após reduzir…
A NASA anunciou a conclusão dos principais testes do novo Observatório Espacial Nancy Grace Roman.…
Segundo estudos recentes, os centros de dados causam danos ambientais e à saúde pública que…
As gigantes chinesas de tecnologia Tencent Holdings e Alibaba Group estão em negociações para investir…