Inter Intel Xeon Ice Lago-SP: Dolgo aproveitado

zgi0mtq4mtnizdlhmdaxntyynzixmzbimjnhnmyxnznhyjkwztqyzwu5mtlim2i2mzeyzja0zgmwztfmyzjimw-4145665

O Lago-SP de gelo pertence à terceira geração de processadores escaláveis Intel Xeon. A primeira, Skylake-SP (Plataforma Purley), saiu no verão de 2017. Na primavera de 2019, a segunda geração foi publicada – Cascade Lake-SP como parte da plataforma de atualização de Purley, que em muitos aspectos pode ser considerada um trabalho em erros do primeiro. E então … então, no verão do mesmo ano, a AMD Epyc Roma apareceu, que para um número de parâmetros – o número de kernels, o volume de caches, o número de canais de memória e sua velocidade, o número de PCIe. 4.0 linhas – acabou por ser dirigido acima do Cascade Lake-sp. Intel prontamente (de acordo com os padrões corporativos, é claro) reduziu os preços para CPU com sufixo L (memória de 4,5 tb por soquete) e simplificou a faixa do modelo, recusando-se aos processadores com o sufixo m (2 TB).

Intel Xeon Ice Lago-SP

E já em 2020, a empresa anunciou uma nova família de Atualização da Cascade Lake-SP, mas foi em grande parte um movimento de marketing. Sim, uma parte significativa dos processadores, alterando o nome, retinha as características e recebeu um preço significativo (às vezes por tempo). No entanto, por exemplo, o modelo de ouro mais antigo 6258R no momento do anúncio não é um análogo completo da platina 8280 mais antigos, uma vez que ainda é igual à 2ª linha de UPI, e não 3, que fecha o caminho a ser usado em multi sistemas superficiais. No entanto, essas duas e meias gerações retêm a compatibilidade no nível do soquete e são o desenvolvimento da microarquitetura de skylake.

nde4zjvmymy5mmnjymy0mmizy2zmndu1otdimmzkmgmyzwq5mjdhmjjjmtczyze5m2y3zmnmowm2ytawztdjmasm-lga_-800-4417023

Mas então uma pequena folha começou. Os primeiros processadores escaláveis da Intel Xeon da terceira geração foram 14-NM Cooper Lake-SP (Plataforma Cedar Island), também herdeiros de Skylake, cujo anúncio no verão de 2020 passou muito quieto, porque essas CPUs não são muito orientadas para o mercado de massa. Eles receberam um novo soquete LGA4189, suporte para memória DDR4-3200 e Optane PMEM 200 (Barlow Pass), 6 linhas UPI e suporte de formato BFloat16.

ndmxnmvjndzmotvkngi1zmezyze5ytq1owfhmjq1yjhkmwjlztiwzgnlzjflngjkyweymze3owmynzhin2izzqsm-wafer_-800-9398567

Isso os faz, por um lado, ideal para construir sistemas de 4 ou 8 soquetes para trabalhar com volumes de dados realmente grandes e, por outro, útil para várias tarefas II, e mesmo em uma versão unilateral (como Facebook, por exemplo). Ao mesmo tempo, o número máximo de núcleos ainda permaneceu igual a 28, bem como no primeiro Skylake-SP, se não contando os monstros duplos do duplo da Cascade Lake-AP. Aqui a bagagem da Intel se aproximou do lançamento da AMD EPYC Milan, que ainda se beneficia em vários aspectos, e ao lançamento de 10-nm Gelo Lago-SP, a segunda família do Xeon Scalabale da terceira geração, e a plataforma Whitley .

O Gelo Lago-SP é dividido com Cooper Lake-SP Socket LGA4189, mas suas plataformas não são compatíveis entre si. O Gelo Lake-SP está focado no mercado de massa de servidores de 1 e 2 soquetes e inclui modelos da série de prata, e não apenas ouro e platina como Cooper Lake-sp. A série de bronze nesta geração não é no começo. Ao mesmo tempo, em comparação com a Cascade Lake-SP (atualização), as diferenças entre as séries restantes tornaram-se menos, mas para o modelo “plano” AMD para EPYC, onde os chips diferem apenas na frequência, o número de núcleos e o volume do cache, enquanto longe.

n2vhodc5mjbjnta4zjqzmzu4nthkmgyzogm5zddjnddlywjlmmu0nmy3ztayodvhmduxyzkymtbkogzmndvknasm-diag_-800-3405610

Todos os processadores do Lago-SP ICE sem sufixos adicionais no suporte de título Sistemas de 2 soquetes, têm 2 portas FMA AVX-512, incluem SGX e TME, oferecem 64 linhas PCIE 4.0 (bifurcação x16, x8, x4) e canais de memória 8 DDR4, O que permite instalar até 4 TB DRAM (com módulos de 256 GB) ou até 4 TB Optano PMEM 200. A memória total com a instalação simultaneamente DRAM e PMEM atinge um registro 6 TB ao soquete. Todas as outras tecnologias que estavam em Cascade Lake-SP, não indo a lugar nenhum.

mzk5ndbjmdlhngrjnjyynwu2njmwnzbmngm2mdayowninta1zjyyogzkzmexotu2nziyzgflnda2zjexngjhnasm-pmem200-800-5781974

«Excepcional “, como de costume, é a série de prata mais jovem, que é mais barata que todo mundo. Ele tem apenas uma CPU com o suporte da Optane PMEM 200, a velocidade da memória (DDR4-2667 para 1dpc / 2pc) e UPI (10,4 gt / s e as linhas são apenas duas), o volume máximo de enclaves SGX é limitado a 8 GB, e também não há nenhuma velocidade selecionada e algumas funções menores. Restrição da série Gold 53xx em comparação (DDR4-2933 para 1dpc / 2pc) com 63xx parece um pouco artificial. Além disso, o conjunto de partida de 53xx é muito pequeno.

ztcwmzfhymu4yjzkndk5odgznmzknmnjntuxmgexytmxntc1mwu1nznlnwzky2zhzjnizgjjzmexmwnhyty4zasm-line_-800-1039963

As numerosas é a série de 63xx. Suas características distintivas: suporte para enclaves SGX de 64 GB e DDR4-3200 (1DPC) ou DDR4-2933 (2DPC). Platinum tem os mesmos enclaves, mas para eles funcionar no modo DDR4-3200 é oficialmente suportado para 2DPC (2 módulos por canal), embora não oficialmente EPYC Milan, como já vimos, também podemos. Platinum tradicionalmente inclui modelos com recursos máximos, e isso preocupa não apenas o número de núcleos, freqüências e o volume do cache.

yzhmzju1ywe3nwyzyjrjzddhy2u2yja3ymvkntu1ymmxndc3ndg0nmq0ytixnzc1ymyznddkmjq2mgnjmzllygsm-sku_-800-3424162

No total, 19 modelos básicos são representados na linha de partida. Mas também há processadores com sufixos adicionais no título, que de acordo com as características podem diferir significativamente dos modelos com o mesmo índice, mas sem sufixo:

H / hl – apenas lembre-se de que esta é uma família Cooper Lake-SP, e não no Lago-SP de gelo;
T – Temperatura avançada, trabalho por 10 anos, “amigável” ao padrão Nebs para o trabalho em condições extremas;
Q – mais altos básicos e turbo-frequências são oferecidos, que é relevante para o HPC, mas é necessário trabalhar com água quente (até +40 ° C na entrada);
U – Suporte para o trabalho apenas como parte de sistemas de tamanho único;
S – Suporte para enclaves SGX com um volume de até 512 GB;
Y – Como Select Select (SST-BF, SST-CP, SST-TF) em um formulário ou outro é na maioria das novas CPUs, agora este sufixo é suportado pelo perfil de desempenho 2.0. SST-PP 2.0, ao contrário da primeira versão, permite que você especifique não apenas a frequência base mínima garantida para o grupo de núcleos selecionados e carregado a eles, mas também turbo-frequência, incluindo a SSE com luz AVX-2, AVX2 Heavy e AVX -512, e também permite alterar dinamicamente essas faixas.
M – Agora, este sufixo significa não suportar a quantidade maior de memória e a disponibilidade de otimizações de frequência das instruções do AVX para trabalhar com conteúdo de mídia e as tarefas da AI;
N – otimização para o trabalho em soluções de rede;
V e P são orientados para virtualização e sistemas de nuvem de SaaS e IAAS, respectivamente, sugerem um tipo de carga na CPU 70% e otimização do SST-PP.

Como os sufixos duplos não são fornecidos, os modelos individuais caindo de uma vez sob várias categorias são atribuídos apenas a um deles. O número de modelos especializados é comparável com o número de básico. Ao mesmo tempo, na prática, a partir de toda a faixa de modelos, um pequeno número de processadores se tornará verdadeiramente enorme, e uma parte significativa dos suprimentos deve ser assumida, como de costume e em todas as soluções personalizadas.

zgmxnti4mdziyjdintizzwyxmmjlyzzkymi5ythhmwi2yzniywzlotviyzcynjkyyzgzmzfkmti2nmiyngqxywsm-pr_9-800-7081313

Se você comparar o Gelo Lago-SP com Cascade Lake-SP (atualização) como um todo, o número mínimo de núcleos aumentou de 6 a 8 anos, o TDP subiu de 70 a 105 W, e o preço inicial aumentou de 13 a 01, Desde que o bronze não mais. Com o máximo de núcleos e TDP, tudo é simples – eles subiram de 28 a 40 e de 205 a 270, respectivamente. Desempenho geral devido a um número de núcleo de crescimento e geração de IPC para geração, de acordo com dados da Intel para a Antiga Xeon Platinum 8280 e 8380, aumentou cerca de 1,5 vezes nas tarefas convencionais e, no caso de uma inferência para a AI – 1,74 vezes, incluindo por otimizações por software.

mzuyngqwmje2otc2mjewmzcyzmfmndbmzjzlywuxyzi4yzy3ztuxngu5zdaxn2ixn2zmodi0yjzlyza4ymzlzqsm-pr_38-800-7673445

Mas com os preços não é tão simples. Não há análogo direto de ouro 6258R na nova série, mas o candidato mais próximo, a Platinum 8358 com o mesmo preço de 950 oferece 32 núcleos em vez de 28, mas com menos frequências. Se você comparar a Platinum 8280 de 8380, o último 900 é mais barato em características mais atraentes. No entanto, ao comparar as características “nuas” da Intel Xeon com EPYC da AMD ao longo do ano passado e meia, a situação não mudou – o Lago-SP Ice está atrasado para trás Milão pelo número de cereais, o volume de casas, frequências, TDP no recálculo do núcleo e a um preço. No último item, faremos novamente uma reserva importante, relevante para ambos os fornecedores: o preço da CPU está longe do único e nem sempre a parte dominante no custo do projeto ou decisão final.

Ambos os fornecedores podem oferecer 128 linhas PCIE 4.0 em 2s-Systems e 4s / 8s Ice Lake-SP e EPYC não estão disponíveis. Mas em soluções de cenário único, este parâmetro é inequivocamente líder AMD – todas as 128 linhas estão disponíveis, pois não é necessário gastar dinheiro no barramento de tecido infinito. Para comunicar duas linhas de ônibus Xeon, de até 3 UPI, que têm uma velocidade ligeiramente classificada – de 10,4 gt / s a 11,2 gt / s (22,4 gb / s em uma direção).

yza1zjhhowvmndhjmdmwmjq4yzk2mtlizwezowqyzta2zjnhmdhlotuxmtkym2ewnjzhmwrhnzbjy2u2nmm4nasm-pr_26-800-9711178

O chipset principal para o novo Xeon permaneceu Lewisburg atualizar C62XA, que oferece mais 20 linhas PCI 3.0, 14 portas SATA3 e USB 2.0 e até 10 portas USB 3.0. Desde os tempos de Skylake-SP, a série perdeu o controlador de 4 × 10GBE embutido, economizando apenas uma porta de controle de 1gbe, e foi tão trabalhado até três modelos, dois dos quais são suportados pela tecnologia Intel Quickassist (QAT) e Conexão opcional à CPU não apenas pelo DMI, mas por 16 linhas PCIE. Em sistemas 2s, dois chipset podem ser conectados se desejado.

zdfhyjvlywzmoti2othjntmyztnhzgexmwm4nmm4njqyyjdmmmninjy0mdljnthlntdmowrkmjc0yzywmzu4masm-lbr_-800-9722236

Para o EPYC, a presença de um chipset não é obrigatória, como é SOC, que, entre outras coisas, inclui a raiz de hardware da confiança (podridão) com base no próprio processador embutido outro SOC. A Intel no caso da abordagem de Whitley é um pouco diferente. Nesta geração, a empresa expandiu a tecnologia da Plataforma Firmware Resilience (Pfr), que usa dois componentes de hardware ao mesmo tempo: processador e CPLD Max 10 (essencialmente FPGA). Quando a PFR é ativada após a alimentação, o controle sobre todo o sistema permanece nas mãos da primeira CPU e CPLD. Antes de carregar, a integridade e correção do firmware e parâmetros BIOS / UEFI, BMC, Intel Me, Controladores de Rede, Dispositivos PCIe e assim por diante são verificados. E se algo não coincide, as imagens de fábrica de software armazenadas separadamente são derramadas.

otk0n2u5mjvhyzq0mgq5nwvinzu5ytbkmdawyje5mzfjowu5ndllmwizmmzhzme0mdqzyta4mje5ngrkmte0ygsm-pfr_-800-1612773

Da mesma forma, atualizando o firmware. Durante a inicialização e depois, a CPLD realmente controla uma série de pneus, incluindo SPI e SMBUS, analisando e filtragem, se necessário, seu tráfego. Assim, é possível evitar a interferência no trabalho de outros componentes: VRM, BP, bacplains, etc. E a programabilidade da CPLD garante a flexibilidade das capacidades de proteção para fornecedores. Um exemplo típico e real – controle da cadeia de suprimentos quando a planta é bloqueada por configuração de ferro e software, e desbloquear só é possível quando a chave é inserida, o que é transmitido para o cliente final.

O Firmware da CPLD e outro software serão publicados em acesso aberto ao GitHub sob a licença do MIT, para que os fornecedores possam usá-lo livremente e personalizar suas necessidades. É verdade que esta medalha e o verso – Pfr podem ser usados não apenas para proteger a plataforma, mas também para uma ligação de usuário final mais rígida a soluções de um fabricante. Embora à primeira vista, ainda é uma opção mais suave do que a AMD PSB, onde está permanentemente ligada à CPU à glândula de um fornecedor particular.

Intel subiu tanto para a produção e gelo no mercado do Lago-SP, que falamos repetidamente sobre as características de novos processadores. A empresa mais completa sobre eles foi contada no ano passado. Então, aqui para destacar algumas inovações-chave, que são uma parte importante da plataforma e com a ajuda da qual a empresa irá distinguir as novidades e da geração passada Xeon e da EPYC.

zmvmyze2zdzjnjfmoge2nzyzmmmxndq1yjk0mmrkndjknmi3yja3odjjn2riytq5zmjiywm5nwrmowfintvhnwsm-sc_-800-4818529

A enseada ensolarada, anunciada no final de 2018, conseguiu “acender” duas vezes nas soluções móveis e até mesmo chegou ao desktop, tendo movido com o processo tecnológico final de 10 nm de volta para 14 nm. Não há complementos para a estrutura do núcleo, que é descrito em dois links anteriores, não é fornecido no servidor. Eles realmente se tornam mais “mais largos” e “mais profundos” devido a um aumento em quase todos os menores / buffers / registradores, bem como partes de entrada e executivos do transportador, e têm um grau maior de paralelismo. Mas, em geral, esta é outra iteração de skylake, embora o crescimento final do IPC aumente em 20% em comparação com a Cascade Lake-SP.

ytziy2yzmmm2nzu1mmy5ndywmtqzytjhmtdlzduxn2jimjk1m2fmotrhnwrmogzhyjzhnty3njy4zwfmndkyywsm-pr_27-800-6879972

A estrutura interna do processador não mudou – este é um cristal monolítico no qual os kernels e agentes adicionais estão conectados pela rede de malha. Tornou-se mais e mais densos, mas não permite, por exemplo, aumentar livremente o tamanho dos menores L3 e o número de núcleos. O que, por sua vez, é parcialmente compensada pelo fato de que no cache para o vizinho ir mais rápido e fácil, e mesmo durante a interação interprocessante, você pode ganhar em atrasos. No design do aglomerado, obviamente será acesso desigual ao acessar dados dentro de um chiplet ou entre eles. Eu me pergunto como isso vai servir a própria Intel próxima geração Xeon, Sapphire Rapids?

yza5zwm0yjzhztaznzhimdrkmzcyzjlloge4njjlymywnjq4oge0yzqymtuxotdimdnizjllotywndc1ztrjmqsm-pr_50-800-6944152

O novo controlador de memória (KP) oferece oito canais DDR4-3200, que é significativamente melhor do que seis canais DDR4-2933 em Cascade Lake-SP, e há quatro agentes de malha agora, que é o dobro de antes. O processador ainda pode ser dividido em dois domínios NUMA (SNC2). Do novo suporte de hardware para criptografia de memória transparente completa (TME) Chave de 128 bits AES-XTS, que é gerado e armazenado dentro da CPU. Este é um analógico da tecnologia da AMD SME.

ngizzdkwzgjiyzcwnwuyowrmzdbkngrhytriymy3zgnjnthjyjmznziymjc2yzk5mmy0yja0zda4njrmzdlhmasm-pr_51-800-8013159

A principal vantagem do novo CP permanece suporte para a segunda geração da Intel Optane PMEM 200 memory, que é quase um terceiro mais rápido do que o anterior, pode funcionar em um modo de 3200 mt / s no Gelo Lake-SP e tem várias outras otimizações . Mas o mais importante, é claro, o fato de que o PMEM é mais barato do que o DRAM ordinário, e a velocidade de tal memória é bastante suficiente para uma classe inteira de tarefas (mas não para todos, é claro). Como observado acima, um total de dois tipos de memória pode ser discado até 6 TB: 8 × 512 GB Optano PMEM + 8 × 256 GB DDR4. No entanto, o PMEM 200 é incompatível com a TME e o SGX.

njiwowu3yjm2zjg2mgjhy2qwogfmzjbhyjfjyje5ywvimwuzzgjjmte0ytg2zmexnwfkztdhmtrlzmnkmjm4mgsm-opt6_-800-9693443

E desde que a Intel agora se tornou o único fabricante 3D Xpoint, a memória de Optane permanecerá exclusiva para suas plataformas. Ambos na forma de DIMM e como SSD. E sim, suporte para PCIe 4.0, por um lado, finalmente, a empresa aproveitará plenamente de suas próprias unidades Optane (P5800x) e SSD (TLC e QLC, até que finalmente ligassem para o SK Hynix), incluindo alta densidade EDSFF E1. L, bem como novos adaptadores de dois portas 100gbe E810 e FPGA AGILEX. E, por outro lado, o desenvolvimento do ecossistema PCIe 4.0 continuará.

yjk0yjm0y2fjyzuyztm5ntrjnmnky2qymzixnjczy2ixodm3ndriyzbmotiymdrhoguynjvlnmfhmti2mmm5mqsm-pr_5-800-6172276

A seguinte inovação importante, que não é realmente nova é expandir o suporte à tecnologia SGX (extensões de proteção de software), que permite criar um enclave na memória protegida do sistema operacional, hipervisor e periferia (pela DMA). A expansão SGX em si parecia como parte do skylake, mas também representou em algumas CPUs (Xeon E) e tinha um limite no tamanho do anklav (até 64 MB). De fato, com sua ajuda, foi possível lidar apenas com pequenos volumes de alguns dados críticos.

zdq5nzbhnzcxndnkywqwntq5ymuyyzezmdc5ywi3ntkxntrhotawmdm2mgq2ngi3yjm2owq4ntfkywi4ztdknasm-pr_31-800-5450098

No entanto, um pequeno ecossistema se desenvolveu em torno da tecnologia: seu apoio é em hipervisores populares, há vários SDK de uma vez, é implementado no Microsoft Azure e na IBM Cloud e assim por diante. O Gelo Lago-SP expande significativamente as possibilidades de usar o SGX, uma vez que o tamanho máximo do enclave é de 8 a 512 GB, mas para a maioria da SKU, este indicador é de 64 GB. A Intel SGX difere da AMD Sev, mas também adequada para implementar computação confidencial completa, treinamento federal ou processamento de dados. Mas sobre isso em seu relatório Intel não falou, então é sobre patchwork de hardware das últimas vulnerabilidades. Aparentemente, acredita-se que tudo está em ordem.

m2jizwe2njg1ywm2otqzmmq4yzizmthlnmfmodniowjhztuwyjfinmfhmte0zji4ymrkmdqymdfjztjimdbmnqsm-pr_28-800-7819859

Finalmente, outro “Cavalo” Xeon, as instruções AVX-512, recebeu novas extensões relacionadas ao trabalho com compressão e criptografia DBMS, (DE). Mais uma vez, eles não são úteis para qualquer software, mas graças a eles Xeon podem ultrapassar outras CPUs para desempenho puro em muitos aspectos. DL Boost Extensões para trabalhar com AI também não foi a qualquer lugar, e o aumento do número de kernels permite que a Intel digasse que em algumas das tarefas de personagens do Lago-SP de gelo, não apenas EPYC é mais rápido, mas também é esperado, mas também a GPU. .

mtm3nzy5mmziyzkxmmm2ntu2njk0zge5mda3mjc0ndnlzda2odyzmdkzyme5mmezyjc4nmmwzjq3zguzm2mxnwsm-pr_30-800-3074200

Mais importante, as instruções SSE, AVX2 e AVX-512 são divididas em luz e pesadas e várias políticas de controle de freqüência foram feitas para eles – instruções de luz podem funcionar por mais tempo em maior frequência. E o processamento do sistema de energia interna permite agora os núcleos, agentes, rede de malha e processador em geral mais rápido para alternar entre frequências e estados. Além disso, o RDT agora permite alterar dinamicamente a priorização dos encadeamentos iniciados e a largura de banda do cache e da memória.

De acordo com a Intel, o aumento final médio no desempenho da plataforma como um todo de geração à geração foi de 1,46 vezes. Em algumas direções, é ainda maior: 1,74 para II-Inferesia, 1.48 para criptografia, 1.58 para Microsviço de nuvem, 1.72 para virtualização, 1.64 para transações do DBMS, 1.53 para HPC. Isso é conseguido graças ao crescimento do número de núcleos e novas instruções e otimizações, como ferro e software. O último item é geralmente muito importante para a Intel – a empresa está ativamente inserida no desenvolvimento e software e soluções de código aberto e soluções de parceiros. E em princípio, tornou-se um pouco mais aberto, especialmente após o lançamento de OneAPI.

zgyxogm3nmfly2m2ndbknwe5m2ywmdczywjlnde3mmjhy2qwnjhjndu2ntyxmme0ogixywixzjdinmmxogq0mgsm-pr_55-800-1531583

A este respeito, a AMD ainda está por trás, mas a empresa agora tem todas as possibilidades de alcançar um concorrente, e está ativamente trabalhando nele. Se você olhar não apenas na CPU, mas no ecossistema como um todo, a Intel está pronta para oferecer ainda mais integração tanto com seu próprio ferro e software quanto com outros produtos. A empresa lembra regularmente as sinergias de suas decisões (e descontos), o que dá um aumento na produtividade em várias tarefas, mas pode ser tratado de maneiras diferentes. Ligação a um fornecedor simplifica atualizações e migração, mas também pode privar algumas oportunidades importantes como foi com PCIE 4.0.

otc2zdcynjvizgqxywnlyjizyjy5nwzly2m5njbknji2mmrlywjimtyzmdbmytgzmwrhzjzjytbhngmzodyxyqsm-pr_52-800-5939564 zwy2y2qzmdywndi1mgqymjyyyzaxzmm2zgm1mtzlywezmzqwyjlizgfiody5ztrhndzmmtdimjq3zjmyzmnlzgsm-pr_53-800-6213261

Mas desta vez, em virtude do tempo e recursos limitados, vamos parar em conhecidos com novas CPUs. A Intel forneceu acesso remoto a dois Xeon Cascade Lake-SP (Clx) e Gelo Lago-SP (ICX), cujas características são mostradas na tabela abaixo. Separadamente, vale a pena notar que o sistema ICX é realmente o SDP (plataforma de desenvolvimento de software) e é um pouco diferente de plataformas de teste e fim, e nem sempre para melhor. Outro ponto importante – para testes, o processador do D2 do passo foi utilizado e não D1 das primeiras partes.

No resto do sistema, se possível, são dados à uniformidade. Memória no modo 1dpc com o máximo para cada frequência de plataforma, perfis de potência / resfriamento e governador de CPU são traduzidos em desempenho, o Turbo-Boost e SMT estão incluídos (a menos que especificado de outra forma), a SNC é desativada, e a unidade principal é NVME SSD PCIe 3.0 x4 com xfs. Pacote de teste – Phoronix Test Suite 10.2.2 no Ubuntu Server 20.10 com GCC 10.2.0. Ao longo do passado, desde o teste, EPYC Milan, alguns componentes do sistema operacional conseguiram atualizar, e não deve ser notado que o kernel e o compilador já foram “introduzindo” com o Gelo Lake-SP.

Mas para um começo, como de costume, o indivíduo, executado em modo manual, e não automático, testes HPL (LINPACK de alto desempenho) 2.3 e fluxo 5.10, em que o SDP e mostrou seu personagem, não permitindo que você desligue o HT, embora Pode ser um pouco melhorado resultados. Esses testes precisavam de conjuntos gratuitos de Base OneAPI e versões de HPC 2021.2.0, que incluem várias bibliotecas otimizadas e o compilador ICC que foram úteis para a montagem do fluxo e o arquivo executável pronto para HPL. Para o fluxo, o SNC2 foi ativado separadamente, e para controle e desempenho de energia HPL (EPB) no caso do ICX foi transferido para o BIOS e traduzido para o modo de desempenho. Para o CLX, HT foi desativado.

Naturalmente, ambos o Benchmarck estão usando ativamente o AVX-512, então o Gelo Technicamente Ice-SP com um número menor de núcleos é capaz de ultrapassar mais Multi-Core EPYC Milan, e em favoritos, as tarefas HPC podem realmente competir com elas:

2 × AMD EPYC 7763 – 3.1840 Tflops;
2 × AMD EPYC 7543 – 2,2044 Tflops;
2 × Intel Xeon Platinum 8368 – 4.4048 Тфлопс;
2 × Intel Xeon Platinum 8260M – 2.45226 Тфлопс.

mdyzmteyoduzywzlnte4mwnmzwe1otlmnjmwnja0ywq2zteyntk5ogjhy2fknmfkzjyyndnkmte2mjg4yzdmnqopenssl-6461085

As bibliotecas OneEapi com ICC foram úteis para o conjunto do motor da Intel Qat, o motor para openssl, que usa características de hardware de acelerar as funções criptográficas usando o Qat em chipsets de Lewisburg. Mas agora ele também “sabe” e sobre novas instruções AVX-512 para as mesmas tarefas no Gelo Lake-SP. Nesse caso, o OpenSSL 1.1.1f foi usado no repositório do Ubuntu com este motor e sem ele.

Outro pequeno teste feito à mão é o HammerDB 4.0 sobre o MySQL 8.0.23. Este é o único teste para o qual a série SSD Intel Optane DC P5800X é usada como o disco principal. Neste teste, o servidor com Gelo Lake-SP foi 1,93 vezes mais rápido que o último servidor de geração:

2 × Intel Xeon Platinum 8368 – 1590759 Nopm / 4820904 MySQL TPM;
2 × Intel Xeon Platinum 8260M – 823890 Nopm / 2497567 MySQL TPM.

mtq2ztgznthjmdq1zmiyzmnmmjzkmtk1odazngjhodeynde5mjcyotdhotjjode3mwzmzjy2mti5y2uyn2u1zasm-pts_-800-3756277

Para pts, foi utilizado o mesmo conjunto de testes e resultados da revisão AMD EPYC Milan. Ai, nem todos os testes funcionaram automaticamente em ambas as máquinas Intel (HPCG, Espresso Quantum, Go HTTP). E da última vez em que foi notado em todo comportamento “indecente” de lamps em um dos carros AMD e também “barulhento” de opt. Portanto, dividimos os resultados em “sujo”, com todos os dados e condicionalmente “limpo”, sem testes incompletos e problemáticos. E selecione os resultados da comparação apenas para Xeon.

zgzly2fiywuwnjg5zwy2yzkxndmynwnjmdq5ogfjmwvmodbhzti3ngq2zgyzowy3oduxzja1mzdhzdzjotq0oasm-ptsr1_-800-8840053

Em geral, os novos processadores de Gelo Lake-SP parecem bem contra a AMD EPYC. Esta última vitória, por exemplo, em compilação, compressão, renderização e seus oponentes estão em tarefas AI, traço, HPC. No entanto, tudo isso diz respeito apenas a este conjunto específico de software. Se você comparar duas gerações escaláveis de Xeon, então novo, novamente, em média, ela se torna 1,35 vezes mais rápido que o passado.

mzkxyzrhmzezzjixzdzizdcxywmzyzc2ntfmmjcxmty3nzjhmzczymfhotnlmtc1ogi0zjkzyte5ngnjnzy5ngsm-geonint-800-1963524

Separadamente, você pode ver o aumento devido a pequenas otimizações em carga roscada, no exemplo do Redis como parte do PTS. A base dos dados e binários, recebidos no teste automatizado, mas o script de inicialização é ligeiramente alterado. Esses resultados são marcados como opt. Uma corrida adicional em Cascade Lake-SP com um limite de frequência máxima para o mesmo que o Lago-SP de gelo é marcado como tampa.

oddhyzg0mdnhnmjkodfhzdk2nwzimjkwmgq1ztbiotqxmjqzotcwzmnjnji2mdc0zjiyzmq1ywfjymqyotcymasm-redisopt-800-7408928

Otimização da Redis.

Intel na situação atual para resistir à AMD “resistência bruta” só (e o que ele faz) – oferecer aos clientes com complexo, otimizado, pronto para implantação rápida de soluções para áreas específicas e necessidades do cliente. E os processadores são apenas uma pequena parte do ecossistema, que inclui optane (PMEM e SSD), Adaptadores Ethernet e Switches, FPGA, Xeon D, Habana Accelerator, Vindo XE e uma enorme quantidade de tecnologias, software e hardware. Afinal, há sempre algo mais do que a quantidade simples de suas partes? Sim, mas o problema é que o Gelo Lago-SP, que deve se tornar o núcleo do ecossistema, parecia muito tarde, dando à AMD em memória e PCIe em um ano e meio e alcançando alguma paridade em dois plating, mas não sistemas de lado.

zjdimgy1ogu5ywiynze3owu4ythly2fhmdjjyty0mmvlyzixyjnkoge0odrmnwe5yziyztuwnwvhnjk3ymyznasm-pr_10-800-7744288

Comparado com a última geração, o novo Xeon Scalabale é óbvio melhor. Em qualquer caso, sobre o exemplo do skus sênior, mas agora não há nada a dizer sobre segmentos muito mais interessantes e de médio e inferiores – no entanto, um aumento no número de núcleos em um cristal monolítico é rapidamente nivelada por uma diminuição na frequência . Em comparação com o EPYC, tudo não é tão inequívoco. Se generalizarmos, então nos lado Xeon – AVX-512 e novas extensões que devem ser capazes de usar. Do lado da AMD – mais núcleos e mais kesha. A memória do Optane PMEM é interessante, mas você não ligará. E para isso, novamente, a adaptação do software é necessária.

y2njmjlintbmnzexmtnhzjg0mwriodm5odjimtzizgqwzduxnta5zdjinte0mwizm2uzode2ztc4zjrhogrkmgsm-roadmap-800-1212170

Mas, talvez, este estado de Intel é bastante adequado? Ainda é líder no mercado, e os fornecedores com os clientes ainda se moverão no Gelo Lago-SP, porém, é necessário acreditar que não em tal ritmo como antes. No futuro próximo, a AMD metade do mercado não é irritante, pois agora depende também dos problemas de produção, embora completamente diferentes. E até que a próxima geração possa ser alcançada. Na verdade, o atual Xeon e Epyc marviel no final da era. Os processadores a seguir aparecerão em breve, e eles simplesmente não trarão suporte para DDR5 e PCIe 5.0, mas também alterarão a abordagem para arquitetura e chips e sistemas. Sim, e o braço deixa ele lentamente, mas ganhando poder.

Para não perder novos materiais, siga-nos no Ya Zen, Telegram, Twitter e LinkedIn.

Inter Intel Xeon Ice Lago-SP: Dolgo aproveitado

Byavalanche

By avalanche

Veja Mais

As montadoras estão se preparando para uma nova escassez de chips após a aquisição holandesa da Nexperia.

The Legend of Khiimori chegará ao Steam Early Access mais tarde do que o esperado – é um simulador de entrega realista ambientado na Mongólia medieval.

O Google planeja testar novos smartphones Pixel com um grupo de entusiastas antes do anúncio.

Deixe um comentário Cancelar resposta