A Ampere Computing anunciou a família de processadores AmpereOne M, projetada especificamente para dar suporte a cargas de trabalho de IA com uso intensivo de recursos em data centers. Dizem que os chips são adequados para tarefas de inferência, trabalho com grandes modelos de linguagem (LLM), IA generativa, etc.
O desenvolvimento de novos produtos foi anunciado pela primeira vez no verão passado. A configuração do processador inclui de 96 a 192 núcleos personalizados de 64 bits baseados no Arm v8.6+. Há 16 KB de cache de instruções e 64 KB de cache de dados L1 por núcleo, e 2 MB de cache L2 por núcleo. O tamanho do cache do sistema é 64 MB. Implementados 12 canais de DDR5-5600 (um módulo DIMM por canal é suportado) com capacidade de endereçar até 3 TB de memória.

Fonte da imagem: Ampere
O design do chip inclui 96 pistas PCIe 5.0 com suporte de bifurcação até o modo x4 e capacidade de usar até 24 dispositivos conectados discretos. São mencionadas ferramentas de virtualização, criptografia de memória, suporte para interrupções I2C, GPIO, QSPI e GPI, temporizadores de sistema e watchdog. Recursos avançados de segurança são fornecidos, incluindo desempenho aprimorado dos algoritmos criptográficos RNG, SHA512 e SHA3.
A série AmpereOne M atualmente inclui seis modelos com velocidades de clock que variam de 2,6 a 3,6 GHz. A classificação TDP varia de 239 a 348 W. Uma rede inteligente de alta largura de banda e um grande número de núcleos de computação de thread único permitem o dimensionamento linear do desempenho com base na carga de trabalho atual. A otimização dinâmica de energia é possível.
Os processadores usam um soquete FCLGA de 7228 pinos. A tecnologia de 5 nm da TSMC é usada na produção. De acordo com a Ampere, as novas CPUs são adequadas para uso em sistemas de rack de servidores de alta densidade. Isso resulta em custos operacionais mais baixos em comparação à infraestrutura de IA baseada em GPU.
