Os últimos dias têm sido ricos em anúncios de novos processadores. A IBM revelou o mais recente POWER10 com suporte de memória OMI DDR5 e PCI Express 5.0, a Intel anunciou o Xeon Ice Lake-SP, que finalmente obteve suporte para PCIe 4.0. O terceiro nesta lista pode ser chamado de Marvell, que no evento Hot Chips 32 contou detalhes sobre a terceira geração de processadores ARM ThunderX, anunciados formalmente nesta primavera.
Os processadores com a arquitetura ARM conquistaram o segmento de dispositivos móveis, mas nos últimos anos outra tendência é mais interessante – essa arquitetura é a base para cada vez mais processadores “grandes” destinados ao uso em servidores. E, como mostra a prática, uma arquitetura considerada “fraca” não é nada disso.
Ele compete com sucesso com o x86, especialmente onde uma alta densidade de capacidade de computação e alta eficiência de energia são necessárias. Exemplos de AWS Graviton2 e processadores personalizados do Google são prova disso, e o desenvolvimento do Fujitsu, o processador A64FX, está no coração do supercomputador mais poderoso do planeta, o cluster japonês Fugaku.
A Marvell é uma das empresas que está fazendo grandes esforços para atingir o mercado de servidores usando a arquitetura ARM. Se os primeiros processadores ThunderX herdados da Broadcom dificilmente podem ser chamados de bem-sucedidos, então a segunda geração já se mostrou bem e, aparentemente, a terceira está finalmente pronta para adoção em massa. Lembre-se de que, ao contrário dos projetos domésticos AWS e Google, os processadores ThunderX3 devem receber suporte multithreading avançado, no nível SMT4, que é mais do que x86, mas menos do que POWER10.
Ao mesmo tempo, o número máximo de núcleos no ThunderX3 é impressionante. Agora sabemos que 96 núcleos estão apenas em uma configuração de matriz dupla (desta forma, a abordagem da Marvell se assemelha ao IBM POWER10, que também existe em duas versões). Um cristal pode carregar até 60 núcleos, o que é menos que o do Graviton2, mas, em primeiro lugar, não muito e, em segundo lugar, é mais do que compensado pela presença de SMT. O SMT4 pode fornecer 240 ou 384 streams, dependendo da versão, e com certeza atrairá grandes provedores de nuvem, pois permitirá que você hospede um número sem precedentes de VMs em um único soquete.
O desempenho de thread único não foi esquecido. A empresa afirma uma superioridade de 30% sobre o ThunderX2 por stream. Em geral, a terceira geração do ThunderX deve ser 2 a 3 vezes mais rápida que a segunda. Arquitetonicamente, o processador é baseado no conjunto de instruções ARM v8.3, no entanto, é dito sobre o suporte parcial para ARM v8.4 / 8.5.
Não há consenso na disputa sobre o que é mais eficiente para conectar núcleos entre si, barramentos em anel ou uma única rede mesh. A Intel prefere a primeira abordagem, mas a Marvell optou pela segunda. Como de costume, o anel externo contém o cache (80 MB L3 por chip), unidades de gerenciamento de energia, bem como controladores de memória, PCI Express e barramento interprocessador (neste caso, CCPI).
O suporte SMT4 é totalmente baseado em hardware. Do ponto de vista do sistema operacional, cada thread do ThunderX3 parece um processador regular com arquitetura ARM. Ao mesmo tempo, a implementação de tal multithreading desenvolvido levou a um aumento de apenas 5% na área de cristal em comparação com a implementação de single-threaded.
A divisão dos recursos do kernel do novo processador é dinâmica, é realizada em quatro pontos: amostragem, quando threads com menos instruções recebem maior prioridade; execução que funciona no mesmo princípio; planejamento baseado na “idade” do riacho; finalmente, “aposentadoria” – aqui a prioridade é dada aos threads com o maior número de instruções. A otimização multithreading permite à Marvell falar sobre escalabilidade quase linear de novos processadores, pelo menos dentro de um soquete. Dependendo do número de instruções por núcleo, o ganho pode variar de x1,28 a 2,21.
O subsistema de E / S dos novos produtos está bastante desenvolvido. O controlador de memória possui 8 canais e suporta DDR4-3200. 16 controladores separados que suportam a quarta versão do padrão são responsáveis pelo suporte PCI Express. Isso deve fornecer um alto nível de desempenho quando conectado a 16 drives NVMe, cada um dos quais terá quatro pistas PCIe.
É declarado sobre gerenciamento de energia “thin”, mas a Marvell não dá detalhes e pode-se apenas imaginar o quão avançado é este subsistema ThunderX3. O novo processador está sendo fabricado nas instalações da TSMC usando a tecnologia de processo de 7 nm. A versão única de 60 núcleos chegará ao mercado ainda este ano, enquanto a versão de matriz dupla com mais núcleos totais começará a ser comercializada no final de 2021. A empresa já está trabalhando no ThunderX4, esses processadores deverão usar a tecnologia de processo de 5nm e serão lançados em 2022.
Em 1975, uma aposta curiosa foi feita na URSS entre cientistas do Instituto de Ciências…
Em 1975, uma aposta curiosa foi feita na URSS entre cientistas do Instituto de Ciências…
Processador Intel Core 2 Duo E4600 2.4 GHz / AMD Athlon 64 X2 4600 2.4…
A Intel foi a primeira a desenvolver uma arquitetura de chiplets claramente desagregada — as…
A maioria dos videogames é projetada para proporcionar diversão e entretenimento, mas o jogo de…
A partir de 1º de janeiro de 2026, o serviço de streaming de jogos GeForce…