Aceleradores de IA especializados não são surpresa agora. As versões projetadas para treinar modelos já alcançaram complexidade e consumo de energia com GPUs modernas, mas os chips usados para executar modelos treinados nem sempre são simples.
A Neuchips fez o contrário com o anúncio do RecAccel N3000 ASIC, que apresenta eficiência aprimorada e geração de calor reduzida em um alto nível de desempenho. Isso o tornará adequado para plataformas de computação de borda “inteligentes” que geralmente são forçadas a operar dentro de restrições térmicas e de energia rígidas. Neste caso, estamos falando de sistemas de inferência compactos, mas poderosos.
O novo produto é feito usando a tecnologia de processo de 7 nm da TSMC e foi originalmente projetado para executar modelos de recomendação de aprendizado profundo (DLRM). Durante o segundo semestre, a empresa pretende lançar no mercado módulos OCP para servidores, em dois formatos ao mesmo tempo: dual M.2 e na forma de placa de expansão com interface PCI Express 5.0.
Fonte: Neuchips
A empresa testou totalmente o RecAccel N3000 no MLPerf e está confiante no sucesso do novo produto. O acelerador usa algoritmos proprietários de quantização e calibração de 8 bits que garantem uma precisão de 99,95% do FP32, o sistema de cache integrado reduzirá o tráfego para a memória externa LPDDR5 em 50% e a eficiência do uso da largura de banda da memória, pelo contrário , aumentará em 30%.
A arquitetura projetada pela Neuchips alcança eficiência energética na região de 1µJ por resultado, permitindo que os desenvolvedores afirmem que a nova plataforma ASIC tem um desempenho melhor do que as inferências planejadas anteriormente de 20M por segundo a 20W. No momento, é bastante difícil avaliar esse indicador em comparação com as soluções existentes, pois podemos falar de diferentes modelos e cenários para sua aplicação.
Observe que esses aceleradores já existiam em 2020. O que se sabe agora é que o RecAccel N3000 receberá RoT de hardware e suportará todos os modelos populares de recomendação de IA, incluindo DLRM, WND, DCN e NCF. No entanto, há motivos para acreditar que tudo isso não são promessas vazias, já que a empresa foi criada pelo ex-chefe da Global Unichip Corporation, subsidiária da TSMC, que desenvolve ASICs e blocos IP personalizados.
Os fãs do jogo de tiro online gratuito Destiny 2, da Bungie, empresa pertencente à…
Mustafa Suleyman, chefe de IA da Microsoft, classificou as tentativas da Anthropic de sugerir que…
O pequeno setor de aviação elétrica atraiu um número significativo de startups, e a japonesa…
Mais de dez anos após o lançamento da primeira versão do aplicativo Telegram para Apple…
O serviço de resposta neural Alice, do Yandex, direciona, com maior frequência, para sites que…
A startup americana de veículos elétricos Rivian seguiu os passos da Tesla, oferecendo inicialmente modelos…