ztnmmgrmnzfkymm5zmm3ntvmngeymmjhmjqwn2y3yme2zgy5ndk3ytvjzgeymdc4mjnizdkwztfkztyxzju4mg-6566872

Os últimos dias têm sido ricos em anúncios de novos processadores. A IBM revelou o mais recente POWER10 com suporte de memória OMI DDR5 e PCI Express 5.0, a Intel anunciou o Xeon Ice Lake-SP, que finalmente obteve suporte para PCIe 4.0. O terceiro nesta lista pode ser chamado de Marvell, que no evento Hot Chips 32 contou detalhes sobre a terceira geração de processadores ARM ThunderX, anunciados formalmente nesta primavera.

Os processadores com a arquitetura ARM conquistaram o segmento de dispositivos móveis, mas nos últimos anos outra tendência é mais interessante – essa arquitetura é a base para cada vez mais processadores “grandes” destinados ao uso em servidores. E, como mostra a prática, uma arquitetura considerada “fraca” não é nada disso.

mzvindvlnzu1ywixnjzlnzcwnzdlotm2ngvhyjm4y2q5yzqzoge1ytcwnda2nznjzjfmymq4mthkmzdkmtg4ngtx3-core_800-1989343

Ele compete com sucesso com o x86, especialmente onde uma alta densidade de capacidade de computação e alta eficiência de energia são necessárias. Exemplos de AWS Graviton2 e processadores personalizados do Google são prova disso, e o desenvolvimento do Fujitsu, o processador A64FX, está no coração do supercomputador mais poderoso do planeta, o cluster japonês Fugaku.

ngexmmi5n2m5zwzkowqzmtnjowzhntllyjk3ztrinzm0njc2m2uwn2ziztgxnjg2mdfinjg3nda2yje4ntdmnqtx3-fetch_800-8294812

A Marvell é uma das empresas que está fazendo grandes esforços para atingir o mercado de servidores usando a arquitetura ARM. Se os primeiros processadores ThunderX herdados da Broadcom dificilmente podem ser chamados de bem-sucedidos, então a segunda geração já se mostrou bem e, aparentemente, a terceira está finalmente pronta para adoção em massa. Lembre-se de que, ao contrário dos projetos domésticos AWS e Google, os processadores ThunderX3 devem receber suporte multithreading avançado, no nível SMT4, que é mais do que x86, mas menos do que POWER10.

nmzhmjeznzq3mzuwndkwyti0zgnln2uzmdu2mwq4mjqyytqxotq5mjflodezzmq2njzjzdiwmmuxyti2ytuzzgtx3-decode_800-1524383

Ao mesmo tempo, o número máximo de núcleos no ThunderX3 é impressionante. Agora sabemos que 96 núcleos estão apenas em uma configuração de matriz dupla (desta forma, a abordagem da Marvell se assemelha ao IBM POWER10, que também existe em duas versões). Um cristal pode carregar até 60 núcleos, o que é menos que o do Graviton2, mas, em primeiro lugar, não muito e, em segundo lugar, é mais do que compensado pela presença de SMT. O SMT4 pode fornecer 240 ou 384 streams, dependendo da versão, e com certeza atrairá grandes provedores de nuvem, pois permitirá que você hospede um número sem precedentes de VMs em um único soquete.

zti1ymrlzji0nwq3otjlmtu5ndk5oge0ndzknzmwnwuymwfhotm5yjnjzwuymddmnjblzjhjogu1ztflnzqxoatx3-sched_800-7270352

O desempenho de thread único não foi esquecido. A empresa afirma uma superioridade de 30% sobre o ThunderX2 por stream. Em geral, a terceira geração do ThunderX deve ser 2 a 3 vezes mais rápida que a segunda. Arquitetonicamente, o processador é baseado no conjunto de instruções ARM v8.3, no entanto, é dito sobre o suporte parcial para ARM v8.4 / 8.5.

nde4ztm5mzhimgiwn2vhmtm4nmrizdlknwy4njvmmdm2mtazmdeymjyyzdk2zte0zwqxn2uzmzu0nzgxytg1mgtx3-l2_800-4306075

Não há consenso na disputa sobre o que é mais eficiente para conectar núcleos entre si, barramentos em anel ou uma única rede mesh. A Intel prefere a primeira abordagem, mas a Marvell optou pela segunda. Como de costume, o anel externo contém o cache (80 MB L3 por chip), unidades de gerenciamento de energia, bem como controladores de memória, PCI Express e barramento interprocessador (neste caso, CCPI).

yji0ndg2ymiyywflnjrinzuzmzrhodvlzjg0njg2mtgymwiyzjg3zguxzjrmnmixnmq2ytkyyjyynzvkmjy2mqtx3-l3_800-7979864

O suporte SMT4 é totalmente baseado em hardware. Do ponto de vista do sistema operacional, cada thread do ThunderX3 parece um processador regular com arquitetura ARM. Ao mesmo tempo, a implementação de tal multithreading desenvolvido levou a um aumento de apenas 5% na área de cristal em comparação com a implementação de single-threaded.

mzyyzgy1m2m5yjyyothjytizyjbmzwiymjuxztliotlkzmexmmniymjjyjg1ywmymtuwnjq0owuxyzu4mwzlmwtx3-smt1_800-5784115

A divisão dos recursos do kernel do novo processador é dinâmica, é realizada em quatro pontos: amostragem, quando threads com menos instruções recebem maior prioridade; execução que funciona no mesmo princípio; planejamento baseado na “idade” do riacho; finalmente, “aposentadoria” – aqui a prioridade é dada aos threads com o maior número de instruções. A otimização multithreading permite à Marvell falar sobre escalabilidade quase linear de novos processadores, pelo menos dentro de um soquete. Dependendo do número de instruções por núcleo, o ganho pode variar de x1,28 a 2,21.

njrizmzlowyynwq0zte3mmfmytk4otc5ymq1nmi1mzm1m2m1mtc5owe4ywjhn2q0ytlindcxnmyxmdc0n2mxmgtx3-smt2_800-3787871

O subsistema de E / S dos novos produtos está bastante desenvolvido. O controlador de memória possui 8 canais e suporta DDR4-3200. 16 controladores separados que suportam a quarta versão do padrão são responsáveis ​​pelo suporte PCI Express. Isso deve fornecer um alto nível de desempenho quando conectado a 16 drives NVMe, cada um dos quais terá quatro pistas PCIe.

otg1zdu1ymfmytq4ndk5mtblzmy4yjblmzbkyzvhowjimtgwndnmmtfmywu5mtrhmge4yjfmmzq5yja4owmwzgtx3-road_800-4878094

É declarado sobre gerenciamento de energia “thin”, mas a Marvell não dá detalhes e pode-se apenas imaginar o quão avançado é este subsistema ThunderX3. O novo processador está sendo fabricado nas instalações da TSMC usando a tecnologia de processo de 7 nm. A versão única de 60 núcleos chegará ao mercado ainda este ano, enquanto a versão de matriz dupla com mais núcleos totais começará a ser comercializada no final de 2021. A empresa já está trabalhando no ThunderX4, esses processadores deverão usar a tecnologia de processo de 5nm e serão lançados em 2022.

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *