Processadores de servidor ARM Marvell ThunderX3: 60 núcleos em SCM, 96 núcleos em MCM, SMT4 de presente

Os últimos dias têm sido ricos em anúncios de novos processadores. A IBM revelou o mais recente POWER10 com suporte de memória OMI DDR5 e PCI Express 5.0, a Intel anunciou o Xeon Ice Lake-SP, que finalmente obteve suporte para PCIe 4.0. O terceiro nesta lista pode ser chamado de Marvell, que no evento Hot Chips 32 contou detalhes sobre a terceira geração de processadores ARM ThunderX, anunciados formalmente nesta primavera.

Os processadores com a arquitetura ARM conquistaram o segmento de dispositivos móveis, mas nos últimos anos outra tendência é mais interessante – essa arquitetura é a base para cada vez mais processadores “grandes” destinados ao uso em servidores. E, como mostra a prática, uma arquitetura considerada “fraca” não é nada disso.

Ele compete com sucesso com o x86, especialmente onde uma alta densidade de capacidade de computação e alta eficiência de energia são necessárias. Exemplos de AWS Graviton2 e processadores personalizados do Google são prova disso, e o desenvolvimento do Fujitsu, o processador A64FX, está no coração do supercomputador mais poderoso do planeta, o cluster japonês Fugaku.

A Marvell é uma das empresas que está fazendo grandes esforços para atingir o mercado de servidores usando a arquitetura ARM. Se os primeiros processadores ThunderX herdados da Broadcom dificilmente podem ser chamados de bem-sucedidos, então a segunda geração já se mostrou bem e, aparentemente, a terceira está finalmente pronta para adoção em massa. Lembre-se de que, ao contrário dos projetos domésticos AWS e Google, os processadores ThunderX3 devem receber suporte multithreading avançado, no nível SMT4, que é mais do que x86, mas menos do que POWER10.

Ao mesmo tempo, o número máximo de núcleos no ThunderX3 é impressionante. Agora sabemos que 96 núcleos estão apenas em uma configuração de matriz dupla (desta forma, a abordagem da Marvell se assemelha ao IBM POWER10, que também existe em duas versões). Um cristal pode carregar até 60 núcleos, o que é menos que o do Graviton2, mas, em primeiro lugar, não muito e, em segundo lugar, é mais do que compensado pela presença de SMT. O SMT4 pode fornecer 240 ou 384 streams, dependendo da versão, e com certeza atrairá grandes provedores de nuvem, pois permitirá que você hospede um número sem precedentes de VMs em um único soquete.

O desempenho de thread único não foi esquecido. A empresa afirma uma superioridade de 30% sobre o ThunderX2 por stream. Em geral, a terceira geração do ThunderX deve ser 2 a 3 vezes mais rápida que a segunda. Arquitetonicamente, o processador é baseado no conjunto de instruções ARM v8.3, no entanto, é dito sobre o suporte parcial para ARM v8.4 / 8.5.

Não há consenso na disputa sobre o que é mais eficiente para conectar núcleos entre si, barramentos em anel ou uma única rede mesh. A Intel prefere a primeira abordagem, mas a Marvell optou pela segunda. Como de costume, o anel externo contém o cache (80 MB L3 por chip), unidades de gerenciamento de energia, bem como controladores de memória, PCI Express e barramento interprocessador (neste caso, CCPI).

O suporte SMT4 é totalmente baseado em hardware. Do ponto de vista do sistema operacional, cada thread do ThunderX3 parece um processador regular com arquitetura ARM. Ao mesmo tempo, a implementação de tal multithreading desenvolvido levou a um aumento de apenas 5% na área de cristal em comparação com a implementação de single-threaded.

A divisão dos recursos do kernel do novo processador é dinâmica, é realizada em quatro pontos: amostragem, quando threads com menos instruções recebem maior prioridade; execução que funciona no mesmo princípio; planejamento baseado na “idade” do riacho; finalmente, “aposentadoria” – aqui a prioridade é dada aos threads com o maior número de instruções. A otimização multithreading permite à Marvell falar sobre escalabilidade quase linear de novos processadores, pelo menos dentro de um soquete. Dependendo do número de instruções por núcleo, o ganho pode variar de x1,28 a 2,21.

O subsistema de E / S dos novos produtos está bastante desenvolvido. O controlador de memória possui 8 canais e suporta DDR4-3200. 16 controladores separados que suportam a quarta versão do padrão são responsáveis ​​pelo suporte PCI Express. Isso deve fornecer um alto nível de desempenho quando conectado a 16 drives NVMe, cada um dos quais terá quatro pistas PCIe.

É declarado sobre gerenciamento de energia “thin”, mas a Marvell não dá detalhes e pode-se apenas imaginar o quão avançado é este subsistema ThunderX3. O novo processador está sendo fabricado nas instalações da TSMC usando a tecnologia de processo de 7 nm. A versão única de 60 núcleos chegará ao mercado ainda este ano, enquanto a versão de matriz dupla com mais núcleos totais começará a ser comercializada no final de 2021. A empresa já está trabalhando no ThunderX4, esses processadores deverão usar a tecnologia de processo de 5nm e serão lançados em 2022.

avalanche

Postagens recentes

NASA convida a todos para ajudar na busca de exoplanetas: se você não tem seu próprio telescópio, basta um smartphone

A NASA anunciou o acesso gratuito para todos ao programa Exoplanet Watch (“Observação de exoplanetas”).…

2 semanas atrás

Fabricante de carros elétricos Rivian perde vários executivos seniores

No início de janeiro, soube-se que a jovem montadora americana Rivian produziu 24.337 veículos elétricos…

2 semanas atrás