A Cadence Design Systems, desenvolvedora de blocos IP, segundo a CNX-Software, criou o núcleo Neo NPU (Neural Processing Unit) – uma unidade de processamento neural projetada para resolver problemas de IA com alta eficiência energética. A solução é adequada para criar SoCs para sensores inteligentes, dispositivos IoT, dispositivos vestíveis, sistemas de assistência ao motorista (ADAS), etc.

Diz-se que o desempenho do Neo NPU é escalonável de 8 GOPS a 80 TOPS por núcleo. No caso de configurações multi-core, o desempenho pode chegar a centenas de TOPS. O núcleo Neo NPU é capaz de lidar com tarefas clássicas de IA e cargas de trabalho generativas de IA. Fala sobre suporte para INT4/8/16 e FP16 para redes neurais convolucionais (CNN), redes neurais recorrentes (RNN) e transformadores.

Fonte da imagem: Cadence

Espera-se que o Neo NPU use tecnologia de fabricação de 7 nm. A velocidade de clock padrão é 1,25 GHz. Comparado com os núcleos IP Cadence AI de primeira geração, afirma-se que o Neo NPU fornece um aumento de 20x no desempenho. A velocidade de inferência por watt por segundo aumenta de 5 a 10 vezes.

Será oferecido aos desenvolvedores um kit NeuroWeave (SDK) com suporte para TensorFlow, ONNX, PyTorch, Caffe2, TensorFlow Lite, MXNet, JAX, bem como Android Neural Network Compiler, TF Lite Delegates e TensorFlow Lite Micro. A solução Neo NPU estará disponível em dezembro de 2023.

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *