Rockchip anuncia acelerador de IA RK182X com arquitetura RISC-V

A Rockchip, de acordo com a CNX Software, revelou o acelerador de IA RK182X na China, projetado para lidar com modelos de linguagem de grande porte (LLM) e modelos de linguagem visual (VLM) na borda. O novo produto foi projetado para ser usado em conjunto com outros SoCs da Rockchip.

O produto possui uma arquitetura RISC-V multi-core (o número exato de núcleos ainda não foi divulgado). Dependendo da versão, são utilizados 2,5 ou 5 GB de memória DRAM com “largura de banda ultra-alta” (o PSP também não é divulgado). O suporte para interfaces PCIe 2.0, USB 3.0 e Ethernet está implementado.

De acordo com a Rockchip, o acelerador de IA RK182X pode processar LLM/VLM com até 7 bilhões de parâmetros. Em particular, esses modelos requerem aproximadamente 3,5 GB de memória ao usar os modos INT4/FP4. A compatibilidade com os frameworks PyTorch, ONNX e TensorFlow, bem como com o formato HuggingFace GGUF (GPT-Generated Unified Format) é mencionada.

Fonte da imagem: Software CNX

O acelerador de IA foi projetado para ser usado em conjunto com processadores Rockchip, como o RK3576/RK3588 e outros, provavelmente incluindo as soluções RK3668 e RK3688, também anunciadas ontem. Esses chips contêm sua própria unidade NPU integrada com desempenho de 6 TOPS ou mais para processamento de cargas de trabalho de IA.

No entanto, ao usar um acelerador separado, o desempenho da IA em determinadas tarefas pode ser aumentado de 8 a 10 vezes. A Rockchip, em particular, publicou os indicadores de velocidade do RK182X para modelos populares como DeepSeek-R1-Distill-Qwen-7B, Qwen2.5-1.5B e Qwen2.5-3B.

admin

Postagens recentes

“Android para Androids”: O Google trouxe a desenvolvedora de software para robôs Intrinsic de volta ao seu controle para fins de inteligência artificial incorporada.

A Intrinsic, subsidiária da Alphabet especializada no desenvolvimento de software para robôs industriais, está sendo…

35 minutos atrás

A Meta✴ instalará mais de 800 geradores a gás para alimentar seu centro de dados de IA no Texas.

O data center Meta✴ de 1 GW em construção em El Paso, Texas, será parcialmente…

2 horas atrás

Um hacker apoiado por Anthropic Claude invadiu o sistema de vários órgãos governamentais no México.

Um cibercriminoso desconhecido, utilizando o chatbot de IA Anthropic Claude, realizou um ataque em larga…

2 horas atrás

Um MacBook de baixo custo com um chip de iPhone pode não ter muitos dos recursos disponíveis em seus modelos mais antigos.

Segundo informações não oficiais, a Apple está se preparando para lançar um MacBook mais acessível…

3 horas atrás