O tópico de PCs montados a partir de componentes do AliExpress não apareceu ontem – a China vem lançando regularmente processadores Xeon desativados de data centers no pregão há muito tempo. Além disso, os comerciantes chineses conseguiram construir em torno deles não apenas o ecossistema necessário, mas também todo um culto, promovido por um grupo bastante grande de blogueiros. Mas quaisquer que sejam os verdadeiros motivos dos vendedores chineses e adeptos russos das compilações baseadas em Xeon com o AliExpress, não se pode negar o fato óbvio: à primeira vista, essas configurações parecem muito atraentes. Os processadores Xeon, apesar de terem sido lançados há vários anos, possuem um grande número de núcleos computacionais e pelo menos não perdem essa característica para as soluções modernas de desktop.

No entanto, até recentemente, não realizamos testes detalhados de Xeons antigos com o AliExpress. Seu óbvio atraso tecnológico em relação às CPUs atuais, juntamente com os problemas que as placas-mãe projetadas para eles por fabricantes chineses trazem, nos pareceram motivos suficientes para que os antigos Xeons não tivessem chance de se tornar uma escolha popular para um público experiente em tecnologia. No entanto, a realidade ao nosso redor mudou muito. Os preços dos componentes no varejo russo são muito instáveis ​​e, além disso, o mercado doméstico de computadores está ameaçado pela escassez de componentes. Ainda é difícil julgar se os cenários negativos são realizados ou não. Mas para mergulhar no tópico do Xeon chinês com mais detalhes, existem razões suficientes de qualquer maneira. A vida pode muito bem dispor que a seleção e encomenda de componentes no AliExpress se tornará não apenas uma das poucas opções possíveis, mas também a mais preferível em termos de preço ao montar novos PCs. Portanto, saber antecipadamente com o que você pode contar neste caso obviamente não será supérfluo.

No mercado chinês pode encontrar uma vasta gama de Xeons usados ​​de várias gerações, orientados para instalação em vários sockets. No entanto, em qualquer caso, todos esses processadores são instâncias que já trabalharam seu tempo nos servidores e, portanto, não estão entre os modernos. Os processadores mais recentes que podem ser encontrados entre os Xeons chineses são os da série Xeon E5 v3 – eles foram produzidos em 2014-2015 e foram destinados ao soquete LGA2011-3. A mesma plataforma foi utilizada, por exemplo, pelo processador Core i7-5960X Extreme Edition HEDT.

É sobre a plataforma LGA2011-3 que será discutida neste artigo. Em primeiro lugar, os processadores para ele são mais modernos e mais produtivos que outras opções do AliExpress: eles são baseados na microarquitetura Haswell e já possuem suporte para SDRAM DDR4. Em segundo lugar, esta família inclui um grande número de modelos diferentes, incluindo aqueles com um número de núcleos de dois dígitos. E em terceiro lugar, para os representantes desta família, os entusiastas aprenderam a habilitar algum tipo de MCE (Multi-Core Enhancements) – uma função que permite aumentar a frequência do clock ativando o modo turbo máximo ao carregar qualquer número de núcleos. Tudo isso junto torna o Xeon E5 v3 mais atraente do que as outras opções – é delas que você pode esperar o máximo desempenho.

Para este teste, pegamos os dois processadores mais populares da família Xeon E5 v3, simplesmente selecionando-os pelo número máximo de compras no AliExpress. Esses processadores eram o Xeon E5-2640 v3 de oito núcleos com um preço de cerca de US$ 25 e o Xeon E5-2678 v3 de doze núcleos, que custa cerca de US$ 110. Vale ressaltar que existem processadores mais sofisticados, por exemplo, processadores de dezoito núcleos no pregão, mas eles não são particularmente populares devido à redundância de tal número de núcleos e maiores requisitos para sistemas de energia e refrigeração. Além disso, uma placa-mãe chinesa com suporte para Xeon E5 v3 tornou-se um participante direto nos testes – seu papel foi desempenhado pelo modelo Huahahzhi X99-BD4 Gaming no valor de US $ 95. Assim, esta análise se concentrará na plataforma completa que qualquer pessoa pode comprar no AliExpress.

⇡#O que você precisa saber sobre o Xeon E5 v3

Os processadores Xeon E5 v3 foram lançados pela Intel no segundo semestre de 2014 e foram resultado da introdução da microarquitetura Haswell no segmento de servidores. Formalmente, Haswell é a segunda iteração da microarquitetura após Sandy Bridge e o primeiro “so”, ou seja, sua alteração significativa. Ao mesmo tempo, os usuários de processadores de desktop, quando a Intel lhes ofereceu Haswell, não ficaram muito satisfeitos com as melhorias introduzidas nesta fase, embora o portador de desktop mais antigo dessa microarquitetura, o Core i7-4770K, tenha se mostrado mais rápido que o carro-chefe Sandy Bridge por 10-15% bastante perceptível.

No entanto, o segmento de servidores encarou o surgimento de Haswell com muito mais otimismo. E o ponto aqui não é tanto no aumento de desempenho, mas nas novas oportunidades que os processadores Xeon E5 v3 deram aos construtores de servidores. Entre eles estão o suporte para instruções vetoriais AVX2 de 256 bits, que é importante para resolver problemas computacionais, um aumento de 1,5 vezes no número máximo de núcleos e suporte para a nova memória DDR4. Tudo isso no total permitiu aumentar o desempenho e a funcionalidade dos servidores de maneira muito mais significativa do que no caso dos sistemas desktop.

Esta lista de mudanças permite que o Xeon E5 v3 ofereça um bom conjunto de recursos no papel e em condições modernas, que é exatamente o que aqueles que promovem essa plataforma entre usuários comuns usam. O suporte para DDR4 possibilita o uso de memória familiar e comum com processadores Xeon E5 v3. As instruções do AVX2 estão agora em demanda não apenas em aplicativos de servidor, mas também em aplicativos de desktop. E a quantidade de núcleos no Xeon E5 v3, que pode chegar a 18, dá a impressão de que o desempenho de tais CPUs é suficiente para os dias de hoje.

No entanto, os processadores Xeon E5 v3, que foram fabricados com tecnologia de processo de 22 nm, não possuem velocidades de clock muito altas. De acordo com essa característica, eles nem superam seus antecessores. Os representantes desta família são caracterizados por frequências de base de cerca de 2,2-3,0 GHz e frequências no modo turbo, atingindo no máximo 3,4-3,8 GHz. Os pacotes térmicos de diferentes modelos de processadores variam de 55 a 145 W, mas é preciso ter em mente que o Haswell é mais quente que outros processadores, pelo menos porque eles tiraram o regulador de potência da placa-mãe.

O Xeon E5 v3 foi projetado para uso em placas-mãe com conector LGA2011-3, que é um pouco diferente daquele usado com processadores LGA2011 anteriores. As mudanças estão associadas à introdução do suporte para DDR4 SDRAM e ao aparecimento de um regulador de energia embutido no Haswell. A propósito, foi graças a ele que novas tecnologias de controle de frequência e tensão foram adicionadas ao Xeon E5 v3 – Per Core P-State e Energy Efficient Turbo. Com a ajuda deles, o processador implementa o controle de frequência nuclear, o que acaba abrindo a notória possibilidade de “bloqueio de turbo boost” no Xeon E5 v3. Graças a isso, o processador pode funcionar na frequência máxima definida pelo modo turbo, com carga em qualquer número de núcleos, e não em um ou dois, como sugere a especificação.

Em 2014, a plataforma LGA2011-3 foi apresentada em duas versões: uma servidora com a lógica do sistema C612 (codinome Grantley) e uma HEDT com o chipset X99. Ambos os chipsets forneciam suporte para portas USB 3.0 e SATA3, além de uma rede gigabit, enquanto os próprios processadores eram responsáveis ​​pela operação do barramento PCI Express 3.0 na plataforma LGA2011-3 – o controlador embutido no Xeon E5 v3 suporta até 40 pistas PCIe. No entanto, tanto o C612 quanto o X99 são relativamente caros e não são mais produzidos pela Intel, portanto, na edição chinesa moderna da plataforma LGA2011-3, chipsets completamente diferentes são usados ​​com mais frequência. Felizmente, o Xeon E5 v3 usa um barramento DMI 2.0 padrão para se comunicar com a lógica do sistema, ao qual uma ampla variedade de chipsets Intel pode ser conectada. Como resultado, no AliExpress existem placas LGA2011-3 baseadas em B85, H81, Q85, Z87 e outros chipsets simples,

No entanto, isso praticamente não afeta a funcionalidade da plataforma. O conjunto principal de suas propriedades é implementado no próprio processador. Todas as pistas PCIe são tiradas diretamente da CPU, e o suporte à memória também depende do próprio processador – em qualquer configuração, a plataforma LGA2011-3 suporta quatro canais DDR4-1866 ou DDR4-2133 na forma de DIMMs sem buffer registrados ou regulares. A única coisa a ter em mente é que alguns fabricantes chineses, por questões de economia, nem sempre distribuem todos os quatro canais de memória nas placas-mãe, limitando-se a suportar SDRAM DDR4 dual-channel. Também entre as ofertas baratas estão placas-mãe para memória DDR3, alguns modelos Xeon E5 v3 também são compatíveis com ela.

⇡#Haswell pode ser considerado uma microarquitetura moderna?

À primeira vista, parece que Haswell é uma microarquitetura muito relevante, que, embora tenha sido desenvolvida há quase uma década, ainda não se tornou obsoleta. Continuando essa lógica, podemos dizer que o moderno Alder Lake não tem nada que reivindique o título de um recurso matador que determina sua superioridade fundamental. Assim, o suporte para AVX-512 em versões desktop de CPUs modernas está desabilitado, e o design híbrido e a tecnologia Thread Director ainda permanecem como prerrogativas de modelos exclusivamente emblemáticos e, além disso, são totalmente suportados apenas no Windows 11.

Ao mesmo tempo, Haswell é seriamente diferente para melhor de sua progenitora, a microarquitetura Sandy Bridge. E isso não é apenas sobre o suporte já mencionado para instruções AVX2, mas sobre mudanças mais fundamentais que foram feitas no nível mais baixo. Haswell aprimorou os algoritmos de previsão de desvios e o tratamento de erros na previsão de desvios; estendeu todos os principais buffers intra-kernel (principalmente buffer de execução fora de ordem); aumentou – de 6 para 8 – o número de portos executivos; e também duplicou o desempenho das operações de salvamento e carregamento de dados, bem como a taxa de transferência do cache de segundo nível.

Microarquitetura Haswell

No entanto, quando você considera o conjunto de melhorias que a Intel conseguiu implementar desde o advento de Haswell, a ideia de qualquer Haswell progressivo parece um exagero. E embora no segmento de desktops, a Intel suspendeu o desenvolvimento de projetos de CPU por quase seis anos, no tempo que se passou desde o advento de Haswell, a empresa ainda conseguiu dar três passos sérios à frente. Essas etapas são Skylake, Cypress Cove e Golden Cove.

Como resultado, se compararmos os núcleos Haswell e Golden Cove, não há dúvida sobre a vantagem esmagadora da microarquitetura atual. Ele é visível em todas as etapas do pipeline de execução. Se falarmos sobre sua parte de entrada, Golden Cove é duas vezes mais rápido que Haswell em termos de buscar instruções do cache L1, possui uma vez e meia mais decodificadores e possui um cache de instruções decodificadas para 4096 e não 1536 micro -operações, que também é capaz de dar-lhes duas vezes mais rápido. A isso, devemos adicionar sérias melhorias na previsão de ramificações – um aumento significativo no buffer de alvos de ramificações e o aparecimento de elementos de IA em seus algoritmos.

Uma expansão significativa da parte de entrada do pipeline de execução encontra uma resposta simétrica em estágios subsequentes. Golden Cove, em comparação com Haswell, é capaz de enviar uma vez e meia mais instruções para execução, para o processamento das quais 12 portas de execução são agora fornecidas contra oito disponíveis em Haswell. Ao mesmo tempo, o buffer de reordenação, dentro do qual as instruções podem ser enviadas para execução fora da ordem do programa, cresceu 2,7 vezes em volume. Tudo isso expande significativamente a microarquitetura Golden Cove em todo o pipeline de execução e, finalmente, torna os núcleos baseados nela muito mais produtivos computacionalmente.

Também deve ser observado aqui que Haswell é seriamente inferior aos processadores modernos em termos de recursos de processamento de dados. A microarquitetura Golden Cove é capaz de realizar três downloads de dados de 256 bits por clock, enquanto Haswell é projetado para apenas dois desses downloads. Além disso, os novos processadores aumentaram significativamente a quantidade de memória cache. Em vez de cache L1D de 32 KB e L2 de 256 KB, os núcleos Golden Cove usam caches L1D de 48 KB e L2 de 1280 KB.

Assim, quase todos os nós-chave da microarquitetura do processador se tornaram mais amplos, mais rápidos ou mais eficientes em pelo menos uma vez e meia nos últimos nove anos desde o advento de Haswell. E isso significa que em termos de IPC (o número de instruções executadas por clock), Haswell deve estar significativamente atrás dos processadores modernos da geração Alder Lake. Para quantificar essa lacuna, fizemos um pequeno teste comparando o desempenho das famílias Haswell e Alder Lake com o mesmo número de núcleos e na mesma velocidade de clock.

Para a pureza do experimento, neste caso, foram usados ​​dois processadores quad-core de desktop Core i7-4770K (Haswell) e Core i3-12100 (Alder Lake) com uma velocidade de clock rigidamente fixada em torno de 4,0 GHz.

E em tal comparação em aplicativos de uso intensivo de recursos, Alder Lake mostrou uma vantagem de aproximadamente uma vez e meia sobre Haswell, o que está em perfeito acordo com a escala de melhorias de microarquitetura descritas acima no Haswell – Skylake – Cypress Cove – Sunny Cove evolutivo caminho.

A situação é ainda mais clara nos jogos. No caso de medir a taxa de quadros com a placa de vídeo GeForce RTX 3090, ao escolher a qualidade máxima em resolução Full HD, a superioridade do Alder Lake em termos de desempenho específico é até um pouco maior do que em aplicativos com uso intensivo de recursos.

E isso significa que os processadores com microarquitetura Haswell ficam atrás das soluções modernas em termos de desempenho específico em pelo menos uma vez e meia. Esta é uma ilustração muito convincente do fato de que, por mais que os adeptos do Xeon com AliExpress queiram, eles não têm o direito de serem considerados soluções modernas.

Além disso, na realidade, a diferença de desempenho entre o Xeon E5 v3 e a geração atual de processadores Intel será ainda mais dramática, pois além do IPC também há uma diferença notável nas velocidades de clock. Haswell foi construído em um processo de 22 nm que atingiu o máximo de 4,0 GHz, e agora uma tecnologia de 10 nm muito mais moderna está em uso, permitindo que os processadores multi-core Alder Lake atinjam a marca de 5 GHz. Ao mesmo tempo, a frequência de representantes multi-core da série Xeon E5 v3, mesmo no caso de “bloqueio de turbo boost”, provavelmente ficará na região de 3,4 GHz, enquanto qualquer um dos desktops Alder Lake, mesmo no nível de entrada, fornecerá uma frequência operacional de pelo menos 4,0 GHz. Essa diferença de frequência se traduz em um atraso de desempenho adicional nas soluções da família Xeon E5 v3,

E isso significa que a diferença no desempenho potencial do Xeon E5 v3 e Alder Lake com o mesmo número de núcleos, de acordo com estimativas aproximadas, será quase o dobro. Portanto, os compradores de processadores de servidor no AliExpress devem estar cientes de que ao comprar um processador de oito núcleos, na melhor das hipóteses, obterão algo no nível do Core i3, e para obter um desempenho semelhante ao do Core i5, você precisa olhar para o Xeon com pelo menos 12 núcleos. Além disso, soluções com microarquitetura Haswell podem ser comparadas com processadores modernos de baixo custo apenas em termos de desempenho multithread e, no caso de cargas de baixo thread, sua competitividade em comparação com qualquer solução moderna é muito duvidosa.

⇡#Xeon E5-2640 v3 e Xeon E5-2678 v3: especificações e recursos

Um número muito grande de CPUs diferentes foi lançado na série Xeon E5 v3, mas em geral, toda essa diversidade se resume a diferenças no número de núcleos de computação e no pacote térmico instalado. Para usuários comuns que estão interessados ​​em construir um PC de uso geral, os modelos com uma frequência mais alta são os principais de interesse e não são modelos mais antigos. O Xeon E5-2640 v3 e o Xeon E5-2678 v3 que escolhemos para teste são populares por um motivo: essas são apenas opções que, por um lado, têm frequências aceitáveis ​​e, por outro lado, podem ter um preço atraente.

O Xeon E5-2640 v3 é um CPU octa-core que pode ser chamado com segurança de ultra-orçamento. Simplesmente não há processadores modernos que custariam algumas dezenas de dólares e, a partir dessa posição, o Xeon E5-2640 v3 é único em seu tipo.

A frequência base deste CPU é de 2,6 GHz, no modo turbo com carga de thread baixo, pode ser acelerado para 3,4 GHz. Essa frequência do Xeon E5-2640 v3 pode ser obtida sob qualquer carga, se você aplicar um hack especial a ela – o chamado bloqueio de turbo boost. Ele é implementado corrigindo o código do BIOS e, na Web, você pode encontrar instruções passo a passo para sua implementação, bem como firmware corrigido pronto para várias placas-mãe chinesas.

A quantidade de memória cache do terceiro nível dos oito núcleos considerados é de 20 MB. Seu controlador de memória suporta quad-channel DDR4-1866 – memória mais rápida, infelizmente, não funciona com o Xeon E5-2640 v3.

O pacote térmico do Xeon E5-2640 v3 está configurado para 90 W, enquanto o processador não aquece muito e não é difícil remover o calor graças a um cristal bastante grande com uma área de 366 mm2 e solda sob a tampa. Mesmo com uma frequência fixada em 3,4 GHz, este processador é comparável em termos de consumo e dissipação de calor ao moderno Ryzen 5 5600X e não requer nenhum sistema de refrigeração complexo.

O segundo processador, o Xeon E5-2678 v3 de 12 núcleos, está na outra ponta da linha de servidores da Haswell, de acordo com vendedores chineses. Está entre as ofertas “elite” do AliExpress – eles pedirão o mesmo que o novo Core i3-12100F. Isso, é claro, está longe de ser um verdadeiro nível premium, mas simplesmente não há opções Xeon E5 v3 usadas mais caras. Até os processadores de 18 núcleos custam aproximadamente o mesmo. Este posicionamento do 12-core é devido às suas características: um número interessante de núcleos, uma boa frequência de clock e uma dissipação de calor aceitável são reunidos aqui.

A frequência base do Xeon E5-2678 v3 de 12 núcleos é de 2,5 GHz e, no modo turbo, sobe para 3,3 GHz. Em valor nominal, a frequência máxima está disponível apenas com uma carga de 1-2 núcleos, mas o processador pode ser configurado de tal forma (fixando o BIOS) que sempre funcionará nele.

O volume de cache L3 em um de 12 núcleos é uma vez e meia maior do que em um de oito núcleos e chega a 30 MB. Ao mesmo tempo, o cache em si é organizado de maneira um pouco diferente do Xeon E5-2640 v3: nesse caso, os segmentos de cache são conectados não por um, mas por dois barramentos de anel com comutadores intermediários. Por esse motivo, partes do cache L3 em relação a um núcleo têm latência ligeiramente diferente. A situação é semelhante com os controladores de memória – neste caso, são usados ​​dois controladores de canal duplo com suporte para DDR4-2133 e não um controlador de quatro canais, como no caso do Xeon E5-2640 v3.

Ao contrário de sua contraparte de oito núcleos, o Xeon E5-2678 v3 é um chip bastante quente. Oficialmente, seu TDP é de 120W e, em operação real, pode aquecer aproximadamente como o Alder Lake de 12 núcleos. Para tal processador, já é necessário um cooler bastante sério.

Separadamente, deve-se mencionar que os processadores Xeon E5 v3, devido à sua finalidade de servidor, são privados de quaisquer recursos de overclock. Seu multiplicador está bloqueado, portanto, nem o Xeon E5-2640 v3 nem o Xeon E5-2678 v3 podem operar em frequências acima de 3,3-3,4 GHz. Da mesma forma, esses processadores também não permitem overclock da memória: DDR4-1866/2133 é o máximo possível. E embora a baixa frequência de memória em sistemas baseados no Xeon E5 v3 seja parcialmente compensada por seus quatro canais, em tais configurações é melhor usar pelo menos módulos sem buffer, que são mais rápidos que os registradores. Discutimos esse ponto separadamente, pois os vendedores do AliExpress costumam oferecer kits que incluem memória de registro de servidor mais lenta.

⇡#Notas sobre placas chinesas LGA2011-3

Como os processadores Xeon E5 v3 são destinados ao uso como parte do equipamento do servidor, eles inicialmente não fizeram placas-mãe “civis” para eles. As únicas exceções são as placas-mãe baseadas no chipset X99 para processadores HEDT da série Core i7-5900X, que também são compatíveis com CPUs de servidor, mas foram lançadas relativamente poucas, e agora é irreal encontrá-las à venda. Portanto, os fabricantes chineses tiveram que resolver esse problema, e o AliExpress foi inundado com um número bastante grande de placas LGA2011-3 de consumo produzidas sob marcas locais como Huananzhi, Jingsha, Machinist e outras.

Todas essas placas são projetadas especificamente para construir PCs desktop baseados no Xeon E5 v3, então elas são dotadas de tais características que o usuário médio obtém do sistema em um processador de servidor a mesma sensação de um desktop comum. É por isso que as placas chinesas para Xeon E5 v3 não têm nada em comum com as placas-mãe de servidores e são muito mais parecidas com as placas modernas para processadores Socket AM4 ou LGA1700. As características do próprio Xeon E5 v3 ajudam muito: o processador possui 40 pistas PCIe 3.0, e esse conjunto é suficiente não apenas para conectar uma placa de vídeo, mas também para implementar slots M.2, bem como para conectar qualquer tipo de controladores. Em outras palavras, apesar do fato de que os chipsets LGA2011-3 foram projetados há muitos anos, os recursos das placas chinesas baseadas neles não parecem arcaicos.

No entanto, há um problema de natureza diferente: os fabricantes chineses de placas são propensos a economias excessivas, e isso pode ser visto em geral em tudo. Como resultado, embora as placas LGA2011-3 do AliExpress ofereçam tudo o que você precisa para um sistema moderno, os controladores instalados nelas (por exemplo, rede ou som) provavelmente serão selecionados entre os mais baratos. As portas USB 3.0 também provavelmente serão poucas, e todas elas provavelmente não terão proteção contra ESD.

Um exemplo específico é a placa de jogos Huahahzhi X99-BD4, que usamos neste teste. A julgar pelo preço, pertence às soluções intermediárias, mas com um conhecimento detalhado de seu design, muitas perguntas surgem. Portanto, seu tamanho é menor que o ATX padrão, e é por isso que não é tão fácil fixá-lo com segurança no gabinete. E o circuito de alimentação do processador tem apenas seis fases e fica muito quente, e é por isso que os chineses tiveram que empilhar resfriamento ativo nele com um par de ventoinhas de 30 mm.

Naturalmente, essas placas não fornecem luz de fundo, bem como a possibilidade de conectá-la, e o controle de velocidade da ventoinha está disponível apenas para um cooler de processador.

Mas ainda mais frustrante é o BIOS das placas chinesas LGA2011-3. Ninguém está engajado em nenhuma adaptação para sistemas desktop, e na verdade o usuário tem que lidar com um conjunto de configurações específicas para servidores, onde tudo é muito, muito específico. Por exemplo, esse BIOS não oferece a possibilidade de alterar os tempos de memória e, para obter acesso a essas configurações, é necessário alterar o firmware para uma versão especial modificada. O mesmo vale para o notório recurso “bloqueio de turbo boost”. Para fazer o Xeon E5 v3 funcionar na frequência máxima, você também precisa modificar o código do BIOS.

Além disso, no processo de uso de placas chinesas, muitas falhas pequenas, mas desagradáveis, aparecem, que estão longe de ser sempre tratadas com sucesso. As discussões sobre essas placas-mãe nos fóruns invariavelmente se estendem por centenas de páginas, o que mostra perfeitamente que você não pode esperar uma vida fácil com elas.

Resultado dos testes. descobertas

⇡#Descrição do sistema de teste e metodologia de teste

De acordo com estimativas preliminares, o Xeon E5 v3, na melhor das hipóteses, pode competir apenas com processadores modernos e baratos. Portanto, em comparação com eles, incluímos representantes de quatro e seis núcleos das famílias Alder Lake e Zen 3, pertencentes às séries Core i3, Core i5 e Ryzen 5.

Os seguintes componentes foram usados ​​nos sistemas de teste:

    • AMD Ryzen 5 5600X (Vermeer, 6 núcleos + SMT, 3,7-4,6 GHz, 32 MB L3);
    • AMD Ryzen 5 5600G (Cezanne, 6 núcleos + SMT, 3,9-4,4 GHz, 16 MB L3);
    • Intel Core i5-12600 (Alder Lake, núcleos 6P + HT, 3,3-4,8 GHz, 18 MB L3);
    • Intel Core i5-12400 (Alder Lake, núcleos 6P + HT, 2,5-4,4 GHz, 18 MB L3);
    • Intel Core i3-12300 (Alder Lake, núcleos 4P + HT, 3,5-4,4 GHz, 12 MB L3);
    • Intel Core i3-12100 (Alder Lake, núcleos 4P + HT, 3,3-4,3 GHz, 12 MB L3);
    • Intel Xeon E5-2678 v3 (Haswell-EP, 12 núcleos + HT, 2,5-3,3 GHz, 30 MB L3);
    • Intel Xeon E5-2640 v3 (Haswell-EP, 8 núcleos + HT, 2,6-3,4 GHz, 20 MB L3).
  • Refrigerador do processador: Noctua NH-D15S.
    • ASUS ROG Strix X570-E Gaming WiFi (Socket AM4, AMD X570);
    • ASUS ROG Strix Z690-F Gaming WiFi (LGA1700, Intel Z690);
    • Huahahzhi X99-BD4 Gaming (LGA2011-3, Intel B85).
    • 4 × SDRAM DDR4-3600 de 16 GB, 16-18-18-38 (Crucial Ballistix RGB BL2K16G36C16U4BL);
    • 2 × 16 Гбайт SDRAM DDR5-6000, 38-38-38-76 (G.Skill Trident Z5 RGB F5-6000U4040E16GX2-TZ5RK).
  • Placa de vídeo: NVIDIA GeForce RTX 3090 Founders Edition (GA102, 1395-1695/19500MHz, 24GB GDDR6X 384-bit)
  • Subsistema de disco: Intel SSD 760p 2TB (SSDPEKKW020T8X1).
  • Fonte de alimentação: Thermaltake Toughpower DPS G RGB 1000W Titanium (80 Plus Titanium, 1000W).

Representantes da série Xeon E5 v3 foram testados na versão mais produtiva – na frequência máxima usando “bloqueio de turbo boost” e com memória sem buffer de quatro canais com tempos reduzidos. Assim, o Xeon E5-2640 v3 de oito núcleos estava rodando a 3,4 GHz com DDR4-1866 com um esquema de atraso de 9-10-10-30-1T, enquanto a frequência do Xeon E5-2678 v3 de 12 núcleos era de 3,3 GHz, e a memória usada com ele funcionou no modo DDR4-2133 com tempos de 10-11-11-32-1T.

O resto dos processadores também foram testados com as restrições de consumo artificial canceladas. Isto significa que os limites de PPT (para a plataforma Socket AM4) e PL1/PL2 (para a plataforma LGA1700) foram ignorados, ao invés disso foram utilizadas as frequências máximas possíveis para obter o melhor desempenho.

Os testes foram realizados em um sistema com a placa de vídeo GeForce RTX 3090 mais rápida para que o desempenho do subsistema gráfico não limitasse o desempenho dos processadores comparados acima e os resultados obtidos em aplicativos de jogos ilustraram as capacidades máximas da CPU, e nada mais.

O teste foi realizado no sistema operacional Microsoft Windows 11 Pro (21H2) Build 22000.282.0 com as atualizações KB5005635 e KB5006746 instaladas e usando o seguinte conjunto de drivers:

  • Driver do chipset AMD 4.03.03.431;
  • Driver do chipset Intel 10.1.18838.8284;
  • Driver Intel SerialIO 30.100.2105.7;
  • Interface do mecanismo de gerenciamento Intel 2124.100.0.1096;
  • Driver NVIDIA GeForce 512.16.

Descrição das ferramentas usadas para medir o desempenho da computação:

Referências abrangentes:

  • Futuremark PCMark 10 Professional Edition 2.1.2508 – teste em cenários Essentials (trabalho típico de um usuário médio: lançamento de aplicativos, navegação na Internet, videoconferência), Produtividade (trabalho de escritório com editor de texto e planilhas), Criação de Conteúdo Digital (conteúdo digital criação: edição de fotografias, edição de vídeo não linear, renderização e visualização de modelos 3D).
  • 3DMark Professional Edition 2.22.7336 – teste no cenário CPU Profile 1.1 com oito threads ativos e com a carga máxima possível do processador.

Formulários:

  • 7-zip 21.02 – teste de velocidade de arquivamento. O tempo gasto pelo arquivador para compactar um diretório com vários arquivos com um volume total de 3,1 GB é medido. O algoritmo LZMA2 e a taxa de compactação máxima são usados.
  • Adobe Photoshop 2021 22.4.3 – Teste de desempenho gráfico. É medido o tempo médio de execução do script de teste Adobe Photoshop CC Benchmark 18.10 da Puget Systems, que simula o processamento típico de uma imagem obtida por uma câmera digital.
  • Adobe Photoshop Lightroom Classic 10.3 – teste de desempenho para processamento em lote de uma série de imagens no formato RAW. O cenário de teste inclui pós-processamento e exportação para JPEG com resolução de 1920 × 1080 e qualidade máxima de duzentas imagens RAW de 16 megapixels tiradas com uma câmera digital Fujifilm X-T1.
  • Adobe Premiere Pro 2021 15.4.0 – teste de desempenho para edição de vídeo não linear. Ele mede o tempo de renderização para o formato 4K do YouTube de um projeto contendo imagens HDV 2160p30 com vários efeitos aplicados.
  • Blender 2.93.5 – testando a velocidade da renderização final em um dos populares pacotes gratuitos para criar gráficos tridimensionais. A duração da construção do modelo final pavillon_barcelona_v1.2 do Blender Benchmark é medida.
  • Mathworks Matlab R2021b (9.11.0) – testando a velocidade de engenharia e cálculos matemáticos em um pacote matemático popular. Um benchmark padrão é usado, que inclui operações matriciais e vetoriais, a solução de sistemas de equações lineares esparsos e simétricos, bem como a construção de gráficos 2D e 3D.
  • Microsoft Visual Studio 2017 (15.9.40) – medindo o tempo de compilação de um grande projeto MSVC – um pacote profissional para criar gráficos tridimensionais Blender versão 2.79b.
  • Stockfish 14.1 – testando a velocidade do popular motor de xadrez. A velocidade de enumeração de variantes na posição “1q6/1r2k1p1/4pp1p/1P1b1P2/3Q4/7P/4B1P1/2R3K1 w” é medida.
  • SVT-AV1 v0.8.6 – testando a velocidade de transcodificação de vídeo no promissor formato AV1. Para avaliar o desempenho, usamos o arquivo de vídeo AVC [email protected] original com uma taxa de bits de cerca de 30 Mbps.
  • Topaz Video Enhance AI v2.3.0 – teste de desempenho em um programa baseado em IA para melhorar os detalhes do vídeo. O teste usa o vídeo original em resolução 640×360, que é duplicada usando o modelo Artemis Anti Aliasing v9.
  • V-Ray 5.00 – teste de desempenho do popular sistema de renderização usando o aplicativo padrão V-Ray Benchmark Next.
  • X265 3.5+8 10bpp — testando a velocidade de transcodificação de vídeo para o formato H.265/HEVC. Para avaliar o desempenho, usamos o arquivo de vídeo AVC [email protected] original com uma taxa de bits de cerca de 42 Mbps.

Jogos:

  • Chernoblita. Resolução 1920 × 1080: Qualidade gráfica = Ultra.
  • Civilization VI: Gathering Storm. Resolução 1920 × 1080: DirectX 12, MSAA = 4x, Impacto no desempenho = Ultra, Impacto na memória = Ultra.
  • Cyberpunk 2077. Resolução 1920×1080: Predefinição rápida = Ray Tracing – Ultra.
  • Far Cry 6. Resolução 1920 × 1080: Qualidade gráfica = Ultra, Texturas HD = Ligado, Anti-Aliasing = TAA.
  • Hitman 3. Tamanho 1920 × 1080: Super Sampling = 1.0, Level of Detail = Ultra, Texture Quality = High, Texture Filter = Anisotropic 16x, SSAO = Ultra, Shadow Quality = Ultra, Mirrors Reflection Quality = High, SSR Quality = High, Sombreamento de Taxa Variável = Qualidade.
  • Horizonte Zero Amanhecer. Resolução 1920 × 1080: Predefinição = Qualidade máxima.
  • Guardiões da Galáxia da Marvel. Tamanho 1920 × 1080: Graphics Preset = Ultra.
  • Sério Sam: caos siberiano. Tamanho 1920 × 1080: Direct3D 11, Velocidade da CPU = Ultra, Velocidade da GPU = Ultra, Memória da GPU = Ultra.
  • Shadow of the Tomb Raider. Resolução 1920 × 1080: DirectX12, Predefinição = Maior, Anti-aliasing = TAA.
  • O Demolidor. Dimensão 1920 × 1080: DirectX12, Qualidade de textura = Alta, Sombras suaves com rastreamento de raio = Ligado, Qualidade de sombra com rastreamento de raio = Ultra, Oclusão de ambiente com rastreamento de raio = Ligado.
  • Uma Saga de Guerra Total: Tróia. Resolução 1920 × 1080: DirectX 12, Qualidade = Ultra, Tamanho da unidade = Extremo.
  • Assista a Legião de cães. Resolução 1920 × 1080: DirectX 12, Qualidade = Ultra, RTX = Desligado, DLSS = Desligado.

Em todos os testes de jogos, os resultados são o número médio de quadros por segundo, bem como o quantil 0,01 (primeiro percentil) para valores de FPS. O uso do quantil 0,01 em vez do FPS mínimo se deve ao desejo de limpar os resultados de rajadas aleatórias de desempenho que foram provocadas por motivos não diretamente relacionados à operação dos principais componentes da plataforma.

⇡#Desempenho em benchmarks complexos

Acontece imediatamente que a velocidade de trabalho em aplicativos de usuários comuns é o ponto fraco do Xeon E5 v3. Em tais cargas, o desempenho de thread único é importante, ou seja, alto IPC e velocidade de clock, e os processadores de servidor em 2014 não podem se orgulhar de nada disso. Portanto, no teste PCMark 10, que reproduz cenários de trabalho diários familiares, o desempenho do Xeon E5-2640 v3 e Xeon E5-2678 v3 é completamente inexpressivo. Eles são significativamente inferiores ao Core i3 mais jovem da série Alder Lake, que possui apenas quatro, mas núcleos modernos. Nos cenários Productivity e Essential office, os representantes da família Xeon E5 v3 são até 33% mais lentos que o Core i3-12100, e no cenário Digital Content Creation, que simula um trabalho simples com conteúdo digital, esse atraso é de 14-18 %.



Em outras palavras, o primeiro teste abrangente mostra que as estimativas obtidas anteriormente estavam absolutamente corretas: a microarquitetura Haswell subjacente ao Xeon E5 v3 é difícil de competir com os modernos núcleos Golden Cove e Zen 3. Os processadores de servidor do AliExpress só podem ser competitivos devido ao número de núcleos e apenas nas tarefas que permitem paralelização eficiente em um grande número de threads computacionais. E essas tarefas quase não estão incluídas no número de tarefas comumente usadas.

Ao mesmo tempo, a paralelização de carga total pode ser vista no teste sintético 3DMark CPU Profile. Ele simula um determinado ambiente de jogo de referência (o ambiente físico e as ações de personagens abstratos que não são do jogo) usando os recursos multi-thread dos processadores. Os diagramas abaixo mostram dois resultados: com uma carga de oito threads, típica da maioria dos jogos modernos de DirectX 12, e com paralelismo total, quando o teste tenta carregar ao máximo todos os núcleos disponíveis no processador.


No primeiro caso, os resultados de ambos Xeon E5 v3 não parecem absolutamente convincentes: eles ficam atrás dos processadores modernos em mais de uma vez e meia, o que coloca em dúvida a conveniência de usar CPUs de servidor antigas no coração dos sistemas de jogos. Mas no teste usando o número máximo de threads, vemos pela primeira vez que o Xeon E5-2640 v3 e o Xeon E5-2678 v3 não estão nos últimos lugares do diagrama. No entanto, seus resultados ainda parecem pálidos: o Xeon E5-2640 v3 de oito núcleos supera apenas ligeiramente o Alder Lake de quatro núcleos, e o Xeon E5-2678 v3 de 12 núcleos não consegue ultrapassar qualquer AMD ou Intel de seis núcleos modernos.

⇡#Desempenho do aplicativo

Tentando encontrar aquelas tarefas reais onde o Xeon E5 v3 ainda pode competir com CPUs modernas, testamos 12 aplicativos heterogêneos. E, em geral, o resultado é bastante decepcionante. Mesmo quando se trata de cargas de trabalho com uso intensivo de recursos, o Xeon E5-2640 v3 de oito núcleos é, na melhor das hipóteses, apenas marginalmente mais rápido que o Core i3 de quatro núcleos, e o Xeon E5-2678 v3 de 12 núcleos quase nunca supera qualquer seis núcleos. processador com uma microarquitetura moderna.

Essa situação é observada mesmo ao renderizar e transcodificar cargas de vídeo, onde o número de núcleos desempenha um papel quase decisivo. Assim, podemos apenas afirmar que houve um progresso significativo no desempenho do processador nos últimos anos, e aquelas soluções de servidor que oito anos atrás estavam na vanguarda do setor e custavam mais de US$ 1.000 hoje parecem produtos de orçamento indefeso.

Renderização:


Processamento de fotos:


Trabalho de vídeo:


Transcodificação de vídeo:


Compilação:

Arquivamento:

Xadrez:

Cálculos matemáticos:

⇡#Desempenho de jogos

No entanto, no contexto do desempenho dos jogos, os resultados do Xeon E5 v3 em aplicativos não parecem tão ruins – nos jogos, todos os pontos fracos desses processadores aparecem muito mais claramente. Baixo desempenho específico e velocidade de clock insuficiente tornam o Xeon E5 v3 uma escolha muito infeliz para sistemas de jogos. E nem um grande número de núcleos, nem um cache L3 espaçoso, nem memória de quatro canais permitem que os processadores AliExpress compitam com pelo menos a geração Alder Lake de quatro núcleos mais jovem.

De acordo com a taxa de quadros média calculada para 12 jogos, o Xeon E5-2640 v3 está 34% atrás do Core i3-12100 de US$ 100. E o mais poderoso Xeon E5-2678 v3 está 29% atrás do mesmo quad-core moderno. Além disso, os processadores usuais de seis núcleos para desktop que a AMD e a Intel estão fabricando atualmente podem oferecer pelo menos uma vez e meia melhor desempenho em jogos. Em outras palavras, construir sistemas de jogos baseados no Xeon E5 v3 é uma má ideia.

Separadamente, deve-se notar que nenhum dos jogos do nosso conjunto de testes pode se aproximar em desempenho das soluções modernas do Xeon E5 v3. Mesmo nos casos em que o desempenho aumenta claramente com o aumento da contagem de núcleos, os processadores de servidor de 8 e 12 núcleos de oito anos atrás são miseravelmente superados por soluções de desktop de baixo custo das gerações atuais.












⇡#Uso de energia

O consumo de energia do Xeon E5 v3 comparado aos chips atuais é de particular interesse. Ainda assim, estamos falando de soluções multi-core incomuns que foram produzidas de acordo com a tecnologia de processo de 22 nm, por isso é importante garantir na prática que seus apetites não ultrapassem o razoável.

Infelizmente, é impossível medir diretamente o consumo de processadores antigos, pois o sensor embutido neles apresenta um erro muito grande. Portanto, para avaliação prática, medimos o consumo total dos sistemas de teste (sem monitor) na saída da fonte de alimentação.

Com uma carga de thread único criada pela renderização no Cinebench R23, os sistemas baseados nos processadores Xeon E5 v3 acabam sendo mais gulosos em comparação com as soluções modernas. No entanto, estamos falando de uma diferença no nível de vários watts e pode ser completamente negligenciada.

No caso de renderização multi-thread, a imagem muda um pouco. O Xeon E5-2640 v3 de oito núcleos mostra menor consumo de energia do que alguns seis núcleos atuais. No entanto, é impossível dizer o mesmo sobre o Xeon E5-2678 v3 – o processador de 12 núcleos consome mais do que todos os outros participantes do teste. Mas seria errado falar sobre algum tipo de apetite “proibitivamente alto” por esse processador. Se os Core i7s de 12 núcleos fossem incluídos na comparação, o Xeon E5-2678 v3 definitivamente não substituiria o anti-líder no diagrama.

O mesmo pode ser dito sobre o consumo de energia no Prime95, onde as instruções AVX2 são usadas ativamente. Em geral, o Xeon E5 v3 se encaixa bem nas ideias modernas sobre quanto os processadores multi-core podem consumir. O único problema é que, consumindo como carros-chefe, eles dão desempenho ao nível das soluções orçamentárias, ou seja, perdem miseravelmente para os chips reais em termos de eficiência energética específica.

⇡#Conclusões

O culto Xeon com AliExpress surgiu longe disso ou mesmo no ano passado, mas há vários anos, e foi isso que deu a oportunidade de tomar forma. Em 2022, o Xeon E5 v3 oferecido pelos chineses não parece ser nenhuma solução interessante, mas quando não havia Zen 3, nem Alder Lake, nem Rocket Lake no mercado, sistemas baseados em processadores de servidor dos primeiros décimos maio E houve alguns benefícios. No mundo moderno, quando ambos os fabricantes de processadores x86 estão fazendo esforços significativos para intensificar o progresso e aumentar o desempenho, os antigos processadores de servidor parecem muito, muito desbotados.

Como os testes mostraram, podemos partir do fato de que cada par de núcleos Xeon E5 v3 é comparável em desempenho multi-thread a um núcleo Alder Lake ou Zen 3. Assim, em cargas paralelizadas, o Xeon E5-2640 v3 de oito núcleos só pode ser comparado com os atuais processadores da classe Core i3, e o Xeon E5-2678 v3 de 12 núcleos não oferece desempenho melhor do que o Core i5 e o Ryzen 5 mais novos.

Ao mesmo tempo, no caso de jogos ou outras cargas de baixo encadeamento, o desempenho de qualquer Xeon E5 v3 no contexto dos chips modernos parece francamente insatisfatório. Em termos de FPS em jogos, eles perdem cerca de 30% para o Core i3-12100 quad-core mais jovem e cerca de 50% para o Core i5-12400 de seis núcleos.

Portanto, se houver uma escolha, os sistemas em processadores modernos são uma opção muito melhor. No entanto, os comerciantes chineses estão bem cientes disso. É por isso que os representantes da família Xeon E5 v3 são vendidos no AliExpress mais baratos que nabos cozidos no vapor – os preços dos processadores de oito núcleos começam em US$ 15, e um processador de 12 núcleos com baixa velocidade de clock pode ser comprado por US$ 45. Na verdade, esses preços estão perfeitamente correlacionados com suas reais capacidades: processadores modernos, mesmo os de nível básico, custam significativamente mais.

Por esta razão, as configurações construídas no Xeon E5 v3 ainda não perderam completamente o seu significado. Eles são adequados para aqueles que desejam construir o PC mais acessível e não exigem muito de seu desempenho. No entanto, deve-se entender que o Xeon E5 v3 não permitirá que você “engane o sistema” e obtenha mais gastando menos. Em última análise, isso nada mais é do que uma solução para montagens ultra-orçamentárias, que também é agravada por várias deficiências: a impossibilidade de atualização, os “recursos” das placas-mãe chinesas, problemas de garantia e assim por diante. Mas é muito, muito barato.

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *