Desde que os processadores Ryzen apareceram na linha da AMD, sua participação no mercado de processadores tem crescido sem parar. Se, por exemplo, falamos de CPU para sistemas desktop, então neste segmento a AMD já tem uma participação de 20 por cento, enquanto na época do lançamento da primeira geração do Ryzen sua participação era de apenas 11%. Este notável aumento nas vendas é um claro indicador de que os processadores da empresa são populares entre os consumidores, e eles cada vez mais preferem AMD em vez de Intel Core ao comprar desktops.
Por que isso acontece não é difícil de entender. A AMD oferece repetidamente processadores e plataformas que, se não sempre e em qualquer lugar mais rápidos e melhores, são mais interessantes em termos de relação preço-desempenho. Foi essa estratégia – fazer processadores baratos, mas decentes, que são mais frequentemente caracterizados por multithreading mais avançado – que trouxe a AMD ao lugar onde está hoje.
Mas agora a empresa pretende mudar a estratégia de seu jogo. Tendo recebido um impulso suficiente de simpatia do usuário e desenvolvido uma nova microarquitetura progressiva Zen 3, a AMD vai se mover de uma maneira diferente – a maneira que geralmente não vai alcançando, mas líderes de mercado que são capazes de oferecer produtos que superam as ofertas concorrentes em propriedades de consumo.
Como resultado, hoje estamos testemunhando um ponto de inflexão em que a AMD está anunciando uma ambição intensamente elevada e a transformação dos processadores Ryzen de acessíveis para caros. A empresa acredita claramente que é o momento certo para uma mudança radical de paradigma. O fato é que agora uma nova geração de processadores Ryzen está entrando no mercado, que promete um sólido pacote de melhorias: um aumento de 19 por cento no desempenho específico por ciclo de clock e, como resultado, uma vitória completa e incondicional sobre um concorrente não apenas no desempenho single-threaded e multi-threaded em recursos intensivos aplicações, mas também em jogos e, ao mesmo tempo, na eficiência energética. Além disso, para maior persuasão, esses processadores têm números de modelo que aumentaram em dois mil de uma vez: desta forma, a AMD parece querer mostrar que o passo dado com a transição para a microarquitetura Zen 3 é essencialmente duplo e diferente de tudo que vimos antes.
Esse conjunto de argumentos arrasadores parece para a AMD o suficiente para pedir aos compradores que paguem 0-100 a mais por novos processadores do que estão acostumados. E estamos inclinados até a concordar com essa formulação da questão, mas desde que todas as afirmações sobre um passo duplo e um aumento de dois dígitos na produtividade sejam verdadeiras. É na verificação dessas teses que estaremos envolvidos neste material sobre a microarquitetura Zen 3 e um casal de representantes seniores da nova linha Ryzen 5000, que estará à venda hoje e estará disponível por 00 e 50.
⇡#Zen 3 tem tudo a ver com CCX duplo
Com o desenvolvimento e implementação da família Zen de microarquitetura, a AMD teve uma taxa de atualização muito alta. O primeiro Zen foi lançado recentemente – em 2017, e hoje já estamos lidando com processadores baseados na microarquitetura Zen 3, que estão três gerações completas atrás dos ancestrais desta classe de CPU. E o que é mais interessante, tanto o Zen quanto o Zen 3, temos que comparar com a microarquitetura Skylake, já que durante todo esse tempo a Intel não foi capaz de modificar de forma significativa seus processadores. Tudo isso deu à AMD uma boa chance não só de acompanhar o concorrente, mas também de superá-lo, pois seria fácil ultrapassar quem está na água.
O Zen 3 é exatamente o ponto em que a conversa sobre os produtos AMD serem melhores lá, mas mais fracos lá, terá que parar. Usando o método de aproximações sucessivas, os desenvolvedores do Zen corrigiram sistematicamente todos os gargalos de sua microarquitetura original e finalmente chegaram à conclusão de que na quarta iteração o Zen 3 se tornou, se não perfeito, pelo menos melhor do que Skylake na grande maioria das tarefas da vida real.
Na verdade, para atingir esse objetivo, ainda fazia pouco mais de um ano e meio, quando a microarquitetura Zen 2 chegou ao mercado. Então a mídia Zen 2 realmente ultrapassou o Skylake em todos os tipos de cargas de computação, cedendo a eles apenas em um caso – nos jogos. Este problema não era sério do ponto de vista arquitetônico, mas aos olhos de uma proporção significativa de usuários, ele oprimia a imagem de Ryzen. Portanto, não é surpreendente que todas as forças no desenvolvimento do Zen 3 foram direcionadas para eliminar essa mesma lacuna.
No entanto, é preciso entender que os desenvolvedores de arquiteturas de processador não operam com os conceitos do nível de “desempenho insuficiente no Shadow of the Tomb Raider”, para eles este problema geral deve ser formalizado em uma linguagem de baixo nível mais compreensível – com uma explicação do que exatamente não deu ao Zen 2 dignamente provaram seu valor em jogos, enquanto em termos de desempenho específico eles claramente superaram os processadores Intel existentes. E aqui a AMD certamente ajudou a comunidade, que apontou incansavelmente as falhas mais críticas na microarquitetura.
A essência do problema com jogos é que todos os aplicativos desse tipo, mesmo bem otimizados para multicore, não funcionam como algoritmos computacionais multithread tradicionais, onde o problema original é dividido em várias subtarefas iguais e paralelas. A carga do jogo é caracterizada pelo fato de ainda ter um fluxo central pronunciado, que em última análise controla tudo o que acontece, enquanto todos os outros fluxos criados são de natureza auxiliar e realmente funcionam para isso. Isso leva ao fato de que tanto a capacidade do processador de transferir dados rapidamente entre diferentes núcleos quanto a capacidade de processar com eficiência a mesma matriz de dados por diferentes núcleos simultaneamente são importantes para jogos. Além disso, neste caso estamos falando de uma quantidade bastante significativa de informações, o que impõe requisitos adicionais sobre a eficiência do trabalho com memória.
Tudo o que foi dito acima é exatamente o que o Zen 2 não estava fazendo bem. Mas, na maior parte, a raiz dos problemas é o uso de complexos CCX fechados em si mesmo (Core Complexes), que contêm quatro núcleos e 16 MB de cache L3 e são combinados em um único conjunto por um barramento Infinity Fabric relativamente lento. Devido a esta estrutura, qualquer Zen 2 com mais de quatro núcleos é incapaz de trabalhar de forma eficiente com uma matriz de dados comum: cada núcleo tem acesso apenas à parte do cache L3 que está em seu próprio complexo CCX e acesso aos dados armazenados no cache – a memória fora dele, leva a atrasos parasitas perceptíveis. É precisamente por isso que o desempenho em jogos modernos sofre: embora os processadores Zen e Zen 2 promovam claramente especificações multi-core, a implementação deste multi-core não implica uma interação suave entre os núcleos: alguns núcleos estão “próximos” uns dos outros, e alguns – “Distante”, que é contra-indicado para o carregamento do jogo.
A principal melhoria feita no Zen 3 aborda essa desigualdade. Não completamente, mas na medida em que a situação como um todo começou a ficar visivelmente diferente. Os complexos CCX no Zen 3 começaram a ser construídos não a partir de quatro, mas de oito núcleos de processador com uma duplicação do tamanho da memória cache compartilhada relacionada a eles para 32 MB. E esta é uma mudança muito importante, já que agora o Ryzen mais popular com seis e oito núcleos finalmente se tornará um único todo – chips com núcleos completamente equivalentes entre si e memória cache de terceiro nível compartilhada realmente comum, cujo acesso a diferentes partes será causar latência previsível, igual e baixa.
O fato de que cada um dos oito núcleos de processador montados a partir de um chip CCD pode funcionar sem problemas com todos os 32 MB de memória cache resultará inevitavelmente em uma aceleração da interação entre núcleos, uma diminuição na latência ao acessar dados em cache e, como resultado, em uma diminuição na latência geral quando multithread trabalha com grandes quantidades de dados. Em outras palavras, do ponto de vista da topologia do processador, o complexo CCX no Zen 3 torna-se o equivalente a um chip CCD: um chip sempre contém um complexo, o que torna desnecessário falar sobre a relação entre os núcleos dentro do chip.
Conseqüentemente, o Zen 3 de 6 e 8 núcleos finalmente pode ser uma boa escolha para jogos, à medida que se distanciam da necessidade de usar o barramento Infinity Fabric para comunicação entre núcleos e chamadas de cache L3. Todo o trabalho dentro do novo complexo CCX de oito núcleos ocorre sem o uso de um Infinity Fabric versátil, mas relativamente lento, e em vez disso, sempre usará um barramento em anel interno dedicado rápido, como aquele que existe nos processadores Intel há muitos anos.
Mesmo assim, o truque tradicional dos processadores AMD com transferência de dados através do Infinity Fabric e a segmentação de memória cache com o lançamento do Zen 3 continua sendo prerrogativa exclusiva dos processadores com 12, 16 e mais núcleos (quando aparecerem no mercado). E no contexto do consumidor Ryzen 5000, isso significa que os compradores da nova geração de quatro, seis e oito núcleos receberão agora um processador estruturalmente monolítico, e não uma espécie de análogo de um sistema de dois processadores em miniatura.
Já o barramento Infinity Fabric, na terceira geração da microarquitetura Zen, manteve seu propósito original como meio de conexão de núcleos apenas em processadores mais antigos de 12 e 16 núcleos, onde, como antes, dois chips CCD são usados. Mas aí você realmente não pode ficar sem esse barramento, pelo menos enquanto a AMD continuar a seguir os princípios de design de vários chips que escolheu. Em teoria, isso pode levar ao fato de que os processadores multi-core serão mais lentos do que os modelos mais simples em alguns aplicativos multi-threaded específicos, mas na realidade essas situações são extremamente raras.
⇡#Desenvolvimento de design de chips
Por ter contado com a montagem de processadores a partir de diversos cristais semicondutores – chiplets, a AMD justificou sua escolha pelo fato de tais CPUs serem mais fáceis de atualizar, pois seus componentes podem ser melhorados peça a peça. A série Ryzen 5000, construída na arquitetura Zen 3, foi construída para corresponder a esse conceito. Dos dois tipos de chips que são usados para projetar processadores – o processador CCD real e os chips de E / S de interface – no Ryzen 5000, apenas os cristais são novos que contêm os núcleos computacionais diretamente.
O chip de E / S no Ryzen 5000 é exatamente o mesmo que no Ryzen 3000, o que significa que os processadores novos e antigos são idênticos em termos de interfaces externas. Não atualizar esta parte da CPU é uma decisão perfeitamente lógica no ambiente atual. Os chipletes fabricados nas instalações da GlobalFoundries usando a tecnologia de processo de E / S de 12 nm atendem plenamente aos requisitos impostos a eles até hoje. Do lado do processador, eles são responsáveis pela operação do barramento Infinity Fabric e, do lado externo, oferecem suporte para 24 pistas PCI Express 4.0 para placa de vídeo, drive NVMe e comunicação com um conjunto de lógica de sistema, além de oferecer suporte para quatro portas USB 3.2.
Além disso, o chip I / O também contém um controlador DDR4 SDRAM, que, de volta ao Ryzen 3000, recebeu propriedades bastante aceitáveis para sistemas modernos, incluindo (finalmente) operação previsível e estável e suporte oficial para DDR4-3200 de canal duplo com capacidade de overclocking não oficial. para o estado DDR4-3733 no modo síncrono. Para ser justo, deve-se notar que alguns usuários expressaram sua insatisfação com a forma como Ryzen 3000 estava suportando overclocking DDR4 SDRAM devido ao fato de que o uso de módulos mais rápidos do que DDR4-3733 levou a uma queda no desempenho devido à necessidade de habilitar o sistema assíncrono Modo de operação Infinity Fabric. Mas seria inútil atualizar o chip de E / S para melhorar a compatibilidade com módulos de memória de alta velocidade. A raiz do problema não está na ausência de algumas otimizações do controlador interno, mas em atingir o limite da frequência do barramento Infinity Fabric, que é colocado do chip CCD ao chip I / O ao longo do textolite da placa do processador. Em outras palavras, a velocidade máxima da memória no modo síncrono é determinada pelo design do chip do próprio processador.
E ainda, mesmo usando o mesmo controlador de memória e o mesmo chip de E / S, a AMD promete que o Ryzen 5000 geralmente será capaz de fazer overclock da memória um pouco melhor do que os processadores da geração anterior. Devido ao descarregamento significativo do barramento Infinity Fabric de transferências de dados entre núcleos, o limite de overclocking de memória estável no Zen 3 no modo síncrono pode ser DDR4-3800 ou DDR4-3933, e se você tiver sorte com uma instância de processador e uma placa-mãe, o modo DDR4 pode se tornar uma realidade. 4000 Pelo menos, essas estimativas são fornecidas pela própria AMD.
A imutabilidade do chip de E / S trouxe outra característica de design de processadores anteriores para o Ryzen 5000: a saber, o barramento de dados foi cortado pela metade na largura na direção do CCD para os chips de E / S. Portanto, os processadores construídos com um único chip CCD em testes de largura de banda de memória continuarão a mostrar o dobro da velocidade de gravação em comparação com a velocidade de leitura – assim como os processadores Ryzen 3000. Mas dificilmente é capaz de desempenho real. de alguma forma afetar negativamente. A leitura da memória a uma velocidade de 32 bytes por ciclo a uma velocidade de gravação de 16 bytes por ciclo, fornecida pelo esquema existente, é bastante consistente com as necessidades dos algoritmos existentes, que no caso geral solicitam dados da memória com mais frequência do que eles são enviados para lá.
Dito isso, não ficaremos surpresos se de repente descobrirmos que a AMD para Ryzen 5000 nem mesmo refez a placa do processador – em geral, não há pré-requisitos objetivos para isso. Mas os chips CCD no Ryzen 5000 são realmente novos – isso pode ser visto pelo menos em suas dimensões. Eles se tornaram maiores, o que sugere involuntariamente que, além de otimizar a estrutura interna, algo mais aconteceu no Zen 3. Isso também é confirmado por indicadores objetivos: se os chips CCD de oito núcleos com microarquitetura Zen 2 consistiam em 3,8 bilhões de transistores e ocupavam uma área de 74 mm2, então com a transição para a microarquitetura Zen 3 seu tamanho aumentou para 80,7 mm2, e o orçamento do transistor aumentou para 4,15 bilhões. Há uma complicação de aproximadamente 10% no cristal.
Ao mesmo tempo, uma comparação direta do Zen 2 e do Zen 3 em termos da área ocupada pelo chip é bastante correta. Rumores anteriores de que a AMD começará a usar um processo tecnológico aprimorado durante a transição para uma nova microarquitetura não foram confirmados. Os chips Zen 3 CCD continuam a ser impressos nas fábricas da TSMC usando exatamente a mesma tecnologia de processo 7nm básica que foi usada antes, sem quaisquer melhorias fundamentais e sem litografia ultravioleta ultra-dura. A única coisa que ocorre é o alcance de alguma maturidade por este processo técnico. Isso é o que permitiu que o Ryzen 5000 abrisse o potencial de frequência adicional, além do auxílio do ajuste mais fino da tecnologia adaptativa Precision Boost 2.
Quanto aos processos técnicos realmente novos, sua implementação em processadores AMD terá que esperar até 2022, quando a empresa apresentará os seguidores do Zen 3 de hoje, construído na microarquitetura Zen 4. É onde a tecnologia 5 nm e a litografia UEV serão aplicadas.
⇡#Mais 19%
Mesmo durante a primeira apresentação introdutória dos novos processadores Ryzen 5000, os representantes da AMD anunciaram que o indicador IPC, ou seja, o desempenho específico de um núcleo por ciclo de clock, aumentou 19% em comparação com seus predecessores. Obviamente, seria impossível fornecer uma aceleração tão séria reformando o CCX sozinho, porque apenas algoritmos selecionados dependem da velocidade de trabalho com o cache e da latência durante a troca de dados entre núcleos. Isso significa que o Zen 3 tem algo mais, e aqueles 10% extras de transistores no núcleo do processador não apareceram à toa.
Na verdade, quando a AMD falou sobre o excelente crescimento de 19 por cento no IPC, mostrou um slide inequívoco de que a contribuição da mudança da estrutura do cache é de apenas cerca de 3%, e várias melhorias na microarquitetura que afetam todos os estágios do executivo são responsáveis pelos 16% restantes. transportador, incluindo sua parte de entrada, domínio executivo e subsistema de processamento de dados.
No entanto, deve ser imediatamente esclarecido que não estamos falando sobre nenhuma mudança fundamental. O Zen 3 continua sendo um Zen típico, e todos os recursos da microarquitetura original são adivinhados nele. Na verdade, os engenheiros da AMD continuam a trabalhar na remoção dos gargalos do projeto original, e o fato de que eles fazem isso de forma tão eficaz pode ser explicado pelo efeito de base baixo e servir como um indicador do desequilíbrio inicial das primeiras gerações do Zen.
Se voltarmos à “supervisão” da AMD de ganho de IPC de 19%, descobrimos que as melhorias no front-end do pipeline, incluindo a unidade de previsão de ramificação e o cache de micro-operações, respondem por quase metade disso. Ao mesmo tempo, não se pode dizer que haja qualquer mudança fundamental no Zen 3: o dispatcher do kernel envia para execução todas as mesmas seis microoperações por relógio, que são fornecidas por um decodificador com o desempenho normal de quatro instruções x86 por relógio, ou por um cache micro-op capaz de entregar na fila para execução de oito microoperações previamente decodificadas. O cache micro-op em si não mudou: como no Zen 2, seu volume foi projetado para quatro mil entradas.
A principal coisa a se procurar mudanças é como funciona a previsão de branch. O buffer de destino de ramificação de nível 1 dobrou para 1.024 registros e o algoritmo de predição estatística multipasso TAGE (geométrica marcada) passou a desempenhar um papel principal. Junto com um aumento no tamanho do array de alvos para transições indiretas, isso tornou possível reduzir os atrasos decorrentes de previsões incorretas e realmente se livrar das “bolhas” ao carregar o pipeline de execução.
Ao mesmo tempo, a AMD conseguiu acelerar a operação do cache micro-op. Ele ganhou a capacidade de produzir os resultados da decodificação de comandos sequenciais com um tempo melhor, e o controlador alterna entre ele e o decodificador agora com melhor eficiência. Além disso, a AMD também está falando sobre como melhorar os algoritmos de cache L1 para obter instruções. Seu tamanho de 32 KB não mudou, mas a pré-busca deveria ter sido mais eficiente.
O fato de que as medidas listadas, apesar de sua aparente insignificância, deram um resultado significativo, é evidenciado não apenas por estimativas numéricas de eficiência, mas também pelo fato de que os arquitetos tiveram que lidar com uma expansão significativa do domínio executivo, tanto no inteiro quanto na parte real dele. O bloco inteiro Zen 3 foi capaz de executar até dez micro-operações em paralelo em vez de sete no Zen 2, e o bloco de ponto flutuante foi capaz de processar seis instruções em paralelo em vez de quatro.
Ao mesmo tempo, é especialmente curioso que no bloco inteiro Zen 3, não surgiram novos ALUs aritmético-lógicos ou geradores de endereços AGU (seu número permaneceu inalterado em comparação com o Zen 2), mas dispositivos executivos dedicados para processamento de ramos (um dispositivo adicionado) e para gravação de dados (dois dispositivos adicionados). Parece que a ideia da necessidade de realizar tais operações separadamente do fluxo principal de comandos foi espionada pelos desenvolvedores da AMD na microarquitetura Skylake, onde esta abordagem foi usada com bastante sucesso por muitos anos.
Mas isso está longe de ser a única melhoria no mecanismo de execução de instruções inteiras. Uma inovação útil foi a unificação dos escalonadores por pares de dispositivos – ALU e AGU – juntamente com o aumento de sua capacidade total, com o objetivo de melhor balanceamento de carga. Além disso, no Zen 3, o tamanho do arquivo de registro cresceu de 180 para 192 registros e de 224 para 256 registros – o buffer de reordenação de instruções.
Mudanças semelhantes encontraram lugar na unidade de processamento responsável pelas operações reais. Dois novos dispositivos executivos foram adicionados aqui, dedicados ao armazenamento de dados e à conversão de números inteiros de ponto flutuante. A capacidade dos planejadores correspondentes também aumentou. E como um bom bônus, a AMD também fala sobre acelerar a velocidade de execução de alguns comandos, em particular, adições de multiplicação combinadas.
O maior paralelismo na execução de instruções acarreta um aumento na necessidade de acesso aos dados. Este é outro aspecto importante que os desenvolvedores do Zen 3 levaram em consideração e, portanto, a taxa de transferência de carregamento e salvamento de dados de e para o cache de dados de primeiro nível foi aumentada. O Zen 2 pode realizar duas operações de carregamento e uma descarga, enquanto o Zen 3 pode realizar até três downloads e até dois salvamentos por ciclo de clock, desde que o número total de operações simultâneas não exceda três. Em outras palavras, o cache L1D permaneceu com três portas (e ao mesmo tempo 32 KB com associatividade 8 vezes), mas sua interface ficou mais flexível e, por isso, mais rápida. No entanto, deve-se ter em mente que, ao servir transferências de 256 bits, sua taxa de transferência é reduzida para duas leituras e uma gravação por ciclo.
Para melhorar a eficiência da interface de dados estendida, os engenheiros da AMD também realizaram algumas otimizações auxiliares. Entre eles – um aumento de 48 para 64 registros da profundidade da fila de descarregamento, bem como busca acelerada ao acessar páginas de memória diferentes.
No final das contas, as mudanças na microarquitetura do kernel se resumem a três coisas fundamentais: previsão de branch aprimorada, 45% mais paralelismo no domínio de execução e maior rendimento ao trabalhar com dados na parte de trás do pipeline. Em suma, todas essas são transformações bastante significativas, que a própria AMD descreve como as mudanças mais significativas em todo o período de desenvolvimento evolutivo dos processadores Zen desde 2017.
Isso só é confirmado pelo fato de que o aumento de 19% no IPC alcançado no Zen 3 em relação à geração anterior supera o aumento no IPC que ocorreu ao mudar a microarquitetura do Zen + para o Zen 2 – então foi estimado em 15%. Além do mais, se você olhar a sequência completa de Zens diferentes, o IPC da nova microarquitetura Zen 3 é 41% maior do que o Zen original, e quase metade desse progresso vem do salto de hoje.
Lineup e overclocking
⇡#O que aconteceu com os atrasos
A AMD conta muitos detalhes interessantes sobre como a microarquitetura mudou na nova geração de processadores. Mas os usuários certamente ficarão mais preocupados com a questão de saber se a AMD finalmente conseguiu vencer a alta latência de memória, os caches CCX vizinhos e as transferências de dados entre núcleos. Afinal, eram eles que criavam os principais problemas de desempenho nos jogos, e por isso eram considerados os mais desagradáveis.
Portanto, nosso conhecimento prático com os primeiros portadores da microarquitetura Zen 3, os processadores Ryzen 5000, começou com o lançamento do teste de memória AIDA64 Cachemem. Para maior clareza, comparamos o desempenho de dois processadores de 16 núcleos: Ryzen 9 3950X, que pertence à geração Zen 2, e o Ryzen 9 5950X da nova geração Zen 3. Para tornar esta comparação o mais reveladora possível, ambos os processadores foram trazidos para a mesma velocidade de clock de 4.0 GHz. A plataforma de teste usou memória DDR4-3600 com latências 16-19-19-39.
E nas leituras do Cachemem há uma verdade: a latência do cache L3 no Zen 3 realmente aumentou, o que é um resultado natural de um aumento duplo na capacidade de seus segmentos relacionados aos complexos CCX. A própria AMD fala sobre isso: enquanto a latência L3 teórica do cache Zen 2 era de 39 ciclos, ela atingiu 46 ciclos no Zen 3. Curiosamente, de acordo com as imagens acima, a vitória inequívoca do processador Ryzen da nova geração está completamente ausente. O cache do primeiro e segundo níveis para representantes das famílias Ryzen 3000 e Ryzen 5000 funciona aproximadamente na mesma velocidade, mas o desempenho do cache L3 na portadora da microarquitetura Zen 3 parece ter sido seriamente afetado.
Mas quanto à redução de duas vezes na largura de banda do cache L3, isso não é inteiramente verdade, mas um efeito colateral da mudança da topologia do processador e da colocação em uso de complexos CCX de oito núcleos em vez de quatro de quatro núcleos. No Ryzen 9 3950X de 16 núcleos, que consistia em quatro CCXs de quatro núcleos, o cache L3 na verdade parecia quatro caches independentes de 16 MB. No Ryzen 9 5950X de 16 núcleos, onde os CCXs são combinados em oito núcleos, o cache L3 já consiste em duas partes de 32 MB. O teste Cachemem é multithread, ele mede a taxa de transferência total ao trocar dados com o cache por todos os núcleos simultaneamente. É por isso que quatro segmentos de cache no processador antigo fornecem o dobro da largura de banda total em comparação com dois segmentos de cache em novas CPUs.
Esta vantagem no rendimento do cache L3 pode ser vista exclusivamente ao medir o desempenho da memória cache multithread. Se falarmos sobre como trabalhar com o cache L3 no contexto de núcleos individuais, então cada um deles, tanto no Zen 2 quanto no Zen 3, está conectado ao cache com um link com largura de banda de 32 bytes por clock. Portanto, ao interagir com a memória cache no modo single-core, não haverá diferenças na largura de banda dos processadores de diferentes gerações. Apenas aplicativos multithread podem sentir a diminuição na velocidade do cache L3, mas o efeito positivo de combinar o dobro de núcleos no CCX e o crescimento da memória cache dentro do CCX deve compensar todos os possíveis efeitos negativos.
Os resultados positivos da transição para o CCX de oito núcleos são visíveis, em particular, ao medir a latência da memória principal. O valor de latência efetiva fornecido pelo Cachemem é visivelmente menor para um processador com microarquitetura Zen 3. E isso não é surpreendente: a topologia do processador que mudou no Ryzen 9 5950X impõe menos penalidades ao verificar a coerência dos segmentos de memória cache e ao transferir dados pelo barramento Infinity Fabric, que agora é descarregado do tráfego para transferência de dados e comandos dentro do chip CCD.
No entanto, você precisa entender que estamos falando aqui sobre como reduzir a latência efetiva como parte de todo o subsistema de memória. Na verdade, o controlador de memória no Ryzen 9 5950X migrou dos processadores da geração anterior sem nenhuma alteração, então a latência para acesso direto à memória para o Ryzen 9 5950X e Ryzen 9 3950X é exatamente a mesma. Isso pode ser visto nos gráficos abaixo para medir a latência da memória desses processadores (reduzida para 4,0 GHz) dependendo dos tamanhos dos blocos.
As diferenças no cache e na latência de encaminhamento da memória entre os processadores Zen 2 e Zen 3 não são realmente tantas. Na verdade, o dobro da quantidade de cache L3 disponível para cada núcleo Zen 3 é significativo, mas ao mesmo tempo suas latências ligeiramente maiores.
É muito mais importante que dobrar o número de núcleos combinados em um complexo CCX e ter acesso igual ao mesmo segmento do cache significa que o dobro de núcleos agora podem trocar informações rapidamente entre si. Você pode ver isso claramente na prática pelos resultados do teste de atrasos que surgem ao transferir dados entre núcleos. Abaixo estão os resultados das alterações nesses atrasos para o Ryzen 9 3950X do ano passado, que consiste em quatro CCXs quad-core, e para o novo Ryzen 9 5950X, que combina oito núcleos em dois CCXs.
Esta imagem é bastante esperada. O número de núcleos que têm a capacidade de se comunicar rapidamente entre si no Ryzen 9 5950X cresceu significativamente. E isso significa que as tarefas que funcionam com vários threads com dados compartilhados podem aumentar significativamente sua produtividade. Essas tarefas incluem principalmente jogos, e não é sem razão que a AMD considera os aplicativos de jogos os principais beneficiários da combinação do dobro de núcleos no CCX.
Ao longo do caminho, deve-se observar que o Ryzen 9 5950X tem um ligeiro aumento na latência de troca entre os núcleos tanto no CCX quanto entre o CCX. Este efeito é devido ao aumento descrito acima na latência do cache L3. Mesmo assim, os processadores AMD superam os multi-núcleos da Intel tanto na série HEDT Skylake-X quanto na família Comet Lake em termos de taxa de troca de dados dentro do CCX. E isso dá aos novos processadores da série Ryzen 5000, especialmente aqueles baseados em um único chip CCD e não usam o barramento Infinity Fabric para comunicação entre núcleos, uma boa chance de tirar soluções como o Core i9-10900K do pedestal de desempenho de jogos.
⇡#Programação de Ryzen 5000
A AMD pulou todos os números de modelo do quarto milhar em sua numeração de processadores de desktop convencionais e foi direto para os índices começando com cinco. Por que o departamento de marketing da empresa tomou essa decisão, não sabemos, mas não parece muito estranho. Como resultado, a quarta milésima série acabou sendo completamente preenchida com processadores Renoir para celulares e desktops com gráficos integrados, e o fundamentalmente novo Vermeer para sistemas mais produtivos, construído na microarquitetura Zen 3 mais progressiva, abriu uma nova página.
Com isso em mente, os predecessores ideológicos do novo Ryzen 5000 são os representantes da série Ryzen 3000, de codinome Matisse. É deles que os novos itens herdam a topologia, o design e os princípios de formação da gama do modelo. Portanto, a gama de processadores Ryzen 5000, construída na nova microarquitetura Zen 3, incluirá modelos com até 16 núcleos. Isso se deve ao design multi-chip introduzido no Ryzen 3000, no qual os principais blocos de construção da CPU são chips CCD de oito núcleos e chips I / O com controlador de memória e interfaces externas. No estágio inicial, a família de processadores Ryzen 5000 incluirá quatro representantes: um Ryzen 5 5600X de seis núcleos e um Ryzen 7 5800X de oito núcleos, montados usando um chip de E / S e um dado CCD; bem como um Ryzen 9 5900X de 12 núcleos e um Ryzen 9 5950X de 16 núcleos, feito de um chip de E / S e dois cristais CCD.
Como antes, para obter processadores de seis e 12 núcleos, a AMD vai recorrer à desativação de um par de núcleos no CCD, mas isso não afeta a quantidade de cache L3: processadores baseados em um CCD têm um cache L3 de 32 MB de qualquer maneira. e com dois CCDs – cache L3 de 64 MB. Com base nisso, eles são muito fáceis de distinguir.
Em comparação com a geração anterior, os representantes da nova série Ryzen 5000 receberam frequências de base mais baixas de 100-200 MHz, mas quase todos os modelos aumentaram as frequências máximas alcançadas no modo turbo. Por exemplo, para o carro-chefe Ryzen 9 5950X, o limite de frequência superior é definido em 4,9 GHz – e isso é 200 MHz a mais do que a frequência máxima dos processadores da geração anterior.
No entanto, o progresso nas velocidades de clock dificilmente pode ser chamado de impressionante. Os novos processadores estão sendo lançados nas instalações de manufatura da TSMC usando a mesma tecnologia de processo de 7 nm de seus predecessores, portanto, todas as melhorias são impulsionadas exclusivamente pela tecnologia de processo atingindo algum grau de maturidade. A AMD já usou esse fator no lançamento do Ryzen 3000XT atualizado, e agora a experiência acumulada é aplicada novamente com um pouco mais de diligência.
Todos os quatro processadores Ryzen 5000 são oficialmente compatíveis com SDRAM DDR4-3200 dual-channel, ou seja, em termos de suporte de memória, eles não diferem de seus predecessores. Isso também não é surpreendente: o chip de E / S com um controlador de memória e um controlador PCI Express 4.0 nos novos processadores permanece antigo. Também há um lado bom nisso: os entusiastas não terão que reaprender como otimizar as configurações de memória: todos os métodos antigos de seleção de frequências e tempos podem ser imediatamente transferidos para novas CPUs.
O pacote térmico dos três modelos seniores com 8, 12 e 16 núcleos é fixado em 105 W, e seu consumo máximo é limitado ao valor tradicional de 142 W. Consequentemente, do ponto de vista do consumo prático de energia e da dissipação de calor, os novos itens provavelmente não ultrapassarão seus antecessores. No entanto, no caso do Ryzen 9 5950X, Ryzen 9 5900X e Ryzen 7 5800X, o fabricante se recusou a equipá-los com sistemas de resfriamento, sugerindo que os usuários decidam sobre a seleção de resfriadores por conta própria. Isso pode ser atribuído ao fato de que o algoritmo de controle de frequência adaptativo Precision Boost 2 usado no Ryzen moderno torna o desempenho dependente, entre outras coisas, da temperatura de operação, de modo que o uso de resfriadores insuficientemente eficientes de uma forma ou de outra leva a uma diminuição no desempenho. E a AMD, ao que parece, quer se livrar da responsabilidade por todos os excessos desse tipo, transferindo-os inteiramente para os ombros dos usuários.
Mas o Ryzen 5 5600X de seis núcleos ainda será fornecido com um cooler completo, que será jogado por Wraith Stealth. Mas este processador também recebeu um pacote térmico mais rígido – 65 W, então não deve haver nenhum problema com seu regime de temperatura.
A AMD sempre tenta enfatizar que seus processadores existem em um ecossistema com uma vida útil muito longa. Ryzen 5000 não é exceção: eles são compatíveis com as placas-mãe Socket AM4 do mercado, mas com reservas significativas. O suporte ao Ryzen 5000 já deve estar disponível para todas as placas construídas nos mais modernos chipsets da série 500: você só precisa atualizar o BIOS para uma versão construída com base nas bibliotecas AGESA 1.1.0.0. Eles serão capazes de fornecer compatibilidade formal com Ryzen 5000 e placas baseadas em 500 chipsets com versões de BIOS construídas em bibliotecas AGESA 1.0.8.0 anteriores, entretanto, neste caso, o funcionamento ideal do sistema não é garantido.
Quanto às placas-mãe mais antigas baseadas em conjuntos lógicos da série 400, o firmware compatível para elas não aparecerá imediatamente. A AMD considera o início do próximo ano as datas possíveis para seu lançamento, mas pode haver vários desvios relacionados à política e aos recursos de cada fabricante de placa-mãe em particular. Mas as placas-mãe construídas com chipsets da série 300 provavelmente não serão capazes de funcionar com o Ryzen 5000, embora alguns modelos individuais provavelmente ainda se tornem uma agradável exceção a esta regra.
Você provavelmente se lembra de que a AMD anterior sempre apresentava novos processadores e novos conjuntos de lógica de sistema. No entanto, desta vez não haverá chipsets da série 600 – a empresa está falando sobre isso explicitamente. Os chipsets mais relevantes para os processadores Socket AM4 após o lançamento do Ryzen 5000 permanecerão os familiares X570 e B550, que irão completar a evolução da plataforma com este soquete de processador. A próxima geração de placas-mãe será lançada apenas quando a AMD mudar para o lançamento de processadores com arquitetura Zen 4 com suporte para memória DDR5 e para um novo soquete.
Um ponto importante, que provavelmente já chamou sua atenção, diz respeito aos preços. Eles, como você pode ver facilmente, aumentaram: cada um dos novos produtos da série Ryzen 5000 é mais caro do que seu antecessor, com o mesmo número de núcleos de computação em 0 ao preço oficial e em todos os 00 no preço da loja. A AMD justifica esta etapa por uma melhoria notável nas novas CPUs e pelo fato de que, apesar do prêmio, eles ainda permanecem os líderes em desempenho por dólar. No entanto, há outro lado: agora o processador mais barato nas quatro operadoras apresentadas da microarquitetura Zen 3 foi avaliado em 00, e esta é uma barra bastante alta, que dificilmente permitirá que se torne um best-seller, muito menos modelos mais caros. Acontece que, embora a AMD não espere substituir rapidamente a antiga linha por uma nova: os processadores Ryzen 5000 ainda serão posicionados como opções para computadores de nível superior à média. Modelos como o Ryzen 5 3600 e Ryzen 7 3700X continuarão a ser enviados junto com novos produtos por enquanto.
No entanto, isso pode ter sua própria lógica associada à edição limitada dos primeiros lotes de novos produtos. Não há dúvida de que um aumento de 19% no IPC, e mesmo com algum aumento na velocidade do clock, atrairá mais atenção dos representantes da série 5000 Ryzen. E isso significa que eles podem muito bem enfrentar um déficit, principalmente no início das vendas. Mas assim que a AMD atender à primeira onda de demanda por novos produtos, a gama de modelos começará a se expandir e opções mais acessíveis aparecerão entre os produtos baseados na microarquitetura Zen 3. De acordo com dados preliminares, este momento deverá ser esperado em algum lugar antes do início do próximo ano.
⇡#Ryzen 9 5950X e Ryzen 9 5900X saiba mais
Para conhecer os representantes da geração Zen 3, a AMD nos forneceu duas amostras de processadores sênior – 12 e 16 núcleos. Ambos os processadores são montados de acordo com o esquema de “dois CCD mais I / O” e se destacam no contexto dos representantes juniores da série não apenas com um grande número de núcleos, mas também com um cache L3 duas vezes maior, bem como frequências de clock aumentadas.
Portanto, de acordo com a especificação, o Ryzen 9 5950X de 16 núcleos e 32 threads tem uma frequência base de 3,4 GHz e pode ter overclock no modo turbo de até 4,9 GHz, e seu cache L3 tem capacidade de 64 MB.
O segundo processador, Ryzen 9 5900X, tem 12 núcleos e 24 threads e é feito de um irmão de 16 núcleos desativando um par de núcleos em cada um dos dois CCDs. Ao mesmo tempo, o tamanho do cache L3 igual a 64 MB é totalmente preservado. Ambos os processadores têm o mesmo 105W TDP e consumo de energia limitado a 142W. Portanto, não é surpreendente que a frequência base do Ryzen 9 5900X com um arsenal menor de núcleos seja visivelmente mais alta do que a de 16 núcleos e seja definida em 3,7 GHz. No entanto, o teto deste processador no modo turbo não é 4,9 GHz, mas apenas 4,8 GHz.
Anteriormente, os processadores Ryzen baseados em núcleos Zen 2 sofriam consistentemente com a incapacidade de atingir as frequências máximas declaradas – escrevemos sobre isso mais de uma vez. Mas com o Ryzen 9 5950X e o Ryzen 9 5900X, a situação mudou dramaticamente. Agora, ao contrário, muitas vezes vão além da frequência máxima indicada na especificação.
Para ilustrar, traçamos a mudança na frequência operacional real do Ryzen 9 5950X e do Ryzen 9 5900X dependendo do número de threads carregados com trabalho. É mostrado abaixo. O teste de renderização Cinebench R20 foi usado como um aplicativo de geração de carga.
Em geral, podemos dizer que Ryzen 9 5950X e Ryzen 9 5900X seguem aproximadamente a mesma fórmula de alteração de frequência, com a diferença de que o primeiro deles é capaz de executar um número maior de threads. Ao mesmo tempo, apesar das diferenças na frequência turbo máxima, ambos os processadores demonstram uma frequência média em uma carga de thread único em 4.925 MHz, que é maior do que os valores declarados na especificação: 25 MHz para o Ryzen 9 5950X e 125 MHz para o Ryzen 9 5900X. Além disso, os picos de frequência para ambos os processadores no modo de thread único durante os testes práticos às vezes atingiam o valor simbólico de 5,0 GHz.
No entanto, a carga multi-threaded completa diminui a frequência real do Ryzen 9 5950X para cerca de 3,8 GHz, e do Ryzen 9 5900X para 4,1 GHz. Os processadores da geração anterior, semelhantes em número de núcleos, trabalharam neste estado em cerca de 100 MHz mais lento, o que, levando em consideração as mesmas restrições de consumo e dissipação de calor, pode servir como mais uma ilustração da melhoria na qualidade do silício de 7 nm saindo do pipeline da TSMC.
Outra inovação agradável foi que o Ryzen 5000 não precisava mais instalar um esquema especial de gerenciamento de energia Ryzen Balanced, que foi implementado no sistema operacional Windows 10 junto com o driver do chipset. Agora, o desempenho ideal e a distribuição de carga adequada entre os núcleos são fornecidos imediatamente, usando apenas as ferramentas do sistema operacional.
Em vez de seu próprio plano de energia, a AMD agora está adicionando um controle deslizante Power and Energy às configurações de economia de energia do Windows 10, que permite ao usuário ajustar a agressividade com que o processador entra em turbo e nos estados de economia de energia.
Dado o fato de que os processadores multi-core Ryzen 9 5950X e Ryzen 9 5900X operam em uma faixa bastante ampla de frequências de clock dependendo da carga, a AMD manteve a mesma abordagem para escolher os cristais CCD para eles, como já era usado nos processadores da geração anterior construídos em dois Chiplets CCD. Essa abordagem envolve a seleção de processadores de dois cristais CCD semicondutores de diferentes qualidades de silício: um é selecionado, capaz de operar em altas frequências, e o segundo é pior. A lógica é que o primeiro dado é responsável por executar cargas de trabalho de baixo encadeamento quando a tecnologia Precision Boost 2 leva o processador a suas frequências máximas. O segundo cristal entra em ação apenas sob cargas pesadas, quando a frequência ainda estará artificialmente subestimada devido a limitações na liberação máxima de calor e consumo de energia.
É muito fácil ilustrar a diferença nos cristais se você observar as frequências limitantes nas quais diferentes chips CCD que fazem parte do Ryzen 9 5950X e Ryzen 9 5900X podem operar de forma estável na mesma tensão. Durante o teste, usamos dois níveis de VCORE – 1,1 e 1,2 V – nos quais encontramos os limites de frequência para CCD0 e CCD1.
No Ryzen 9 5900X de 12 núcleos, a qualidade dos chips CCD difere tanto que suas frequências máximas na mesma voltagem divergem em 150 MHz significativos. Além disso, o melhor primeiro cristal CCD0 acaba sendo capaz de pegar uma frequência de 4,5 GHz a uma tensão de 1,2 V e manter a estabilidade neste estado mesmo sob testes de estresse no Prime95.
Neste contexto, os parâmetros dos cristais no Ryzen 9 5950X foram uma surpresa. O melhor chip CCD neste processador mostrou aproximadamente os mesmos limites de frequência que o pior chip chip no Ryzen 9 5900X. E o CCD1 de um processador de 16 núcleos a 1,2 V geralmente durava apenas até 4,25 GHz.
No entanto, isso não significa de forma alguma que o Ryzen 9 5950X esteja sendo rejeitado. No final, como vimos antes, em uma carga de thread único, este processador pode travar até uma altura de 5 GHz. O ponto aqui é que a AMD envia cristais com baixas correntes de fuga estática para seu processador principal. Esses cristais são caracterizados por menos aquecimento, o que certamente é crítico para um 16 núcleos, mas ao mesmo tempo eles realmente requerem o uso de níveis de voltagem mais elevados.
⇡#Overclock
Com base no fato de que as frequências de passaporte do Ryzen 5000 em relação ao Ryzen 3000 aumentaram insignificantemente, é lógico supor que a situação com potenciais de overclock também não mudou muito. Na verdade, os processadores da série Ryzen 5000 usam exatamente a mesma tecnologia de processo de 7 nm que no caso do Ryzen 3000XT, então o aumento na frequência máxima de overclocking pode ter ocorrido principalmente devido a mudanças na microarquitetura no Zen 3, o que poderia levar a um aumento no comprimento do pipeline executivo … Mas, como mostra a experiência, geralmente em tais casos, nenhuma mudança cardinal ocorre nas frequências.
No entanto, no caso dos processadores Ryzen 5000, ainda há algumas notícias positivas. Ryzen 9 3900XT, que visitou nosso laboratório uma vez, fez overclock para 4,2 GHz, mantendo total estabilidade no Prime95, e os novos processadores Ryzen 9 5900X e Ryzen 9 5950X, que foram usados na preparação desta análise, foram capazes de se orgulhar da capacidade de manter a estabilidade em uma frequência de 4 , 4 GHz.
Mais especificamente, o Ryzen 9 5900X teve um desempenho suave a 4,4 GHz usando um VCORE de 1,25 V. E o teste de estresse Prime95 30,3 aqueceu este processador em 88 graus.
Ryzen 9 5950X também foi capaz de operar a 4,4 GHz, mas a tensão necessária para isso acabou sendo visivelmente maior – 1,325 V, o que mais uma vez confirma a teoria de usar silício com baixas correntes de fuga neste processador. A alta tensão neste caso permite alcançar estabilidade completa, mas não leva ao superaquecimento: as temperaturas do Ryzen 9 5950X testado no Prime95 30.3 não ultrapassaram 96 graus, enquanto o limite crítico é considerado 115 graus.
No entanto, deve-se notar que para remover o calor dos processadores em experimentos de overclock, usamos um sistema de refrigeração líquida personalizado com um dissipador de calor de 360 mm construído com componentes EKWB. É um tipo de dissipação de calor muito eficiente que supera os resfriadores de ar tradicionais e LSS de circuito fechado de fábrica. Portanto, em sistemas onde sistemas mais simples serão responsáveis pelo resfriamento, o overclock do novo Ryzen 5000 para 4,4 GHz pode não ser possível devido ao superaquecimento.
Representantes seniores da linha Ryzen 5000 participaram de nossos experimentos – processadores de 12 e 16 núcleos construídos com base em dois cristais CCD. Obviamente, esses processadores esquentam muito mais forte do que os modelos com menos núcleos. Portanto, do Ryzen 7 5800X e Ryzen 5 5600X você pode esperar melhores resultados de overclocking, temperaturas mais baixas e sistemas de refrigeração menos exigentes. Poderemos verificar tudo isso mais tarde – nas próximas revisões.
Por falar em overclocking, é importante mencionar que, em geral, o conjunto de ferramentas de overclocking que são implementadas nos processadores de nova geração não mudou, e todas as abordagens antigas funcionam com sucesso com o Ryzen 5000. Ao mesmo tempo, nenhuma inovação útil de overclocking, em geral, apareceu. Muitos entusiastas esperavam o surgimento da possibilidade de overclocking por núcleo separado dos novos produtos, mas esta função permaneceu não realizada. Freqüências diferentes em novos processadores podem ser definidas apenas para CCXs individuais, que agora cresceram para o tamanho de CCDs. Isso significa, de fato, que o Ryzen 5000 perdeu uma quantidade significativa de flexibilidade de overclock. No entanto, overclocking separado no nível dos chips CCD pode fazer sentido, porque como vimos acima, o primeiro chip CCD em um processador de 12 e 16 núcleos é perfeitamente capaz de fornecer uma frequência melhor a 100-200 MHz do que o segundo. O único “mas” – esta abordagem é aplicável apenas para Ryzen 9 5950X e Ryzen 9 5900X, e os processadores das séries Ryzen 7 e Ryzen 5 com um único chip CCD usam a mesma frequência para todos os seus núcleos.
Outro aspecto importante do overclock do Ryzen 5000 diz respeito ao desempenho da memória. Mesmo antes do anúncio desses processadores, havia informações de que os limites de overclock de memória neles seriam maiores, e a AMD não negou.
Lembre-se de que nos processadores AMD modernos, apenas tal overclock de memória é racional, no qual, simultaneamente com a frequência dos módulos DDR4 SDRAM, a frequência do controlador de memória e a frequência do barramento Infinity Fabric, conectando o controlador de memória com os núcleos do processador e cache L3, são aumentadas de forma síncrona. Somente quando essas três frequências estão sincronizadas entre si, a latência é mínima e o desempenho real aumenta.
Por esta razão, os módulos de memória DDR4-3600 ou DDR4-3733 foram uma escolha inteligente para sistemas baseados em Ryzen 3000. A frequência limite do barramento Infinity Fabric, no qual os processadores da geração anterior funcionavam de forma estável, era de 1800-1867 MHz, e ao fazer o overclock da memória para modos além de DDR4-3733, o relógio síncrono da memória e do barramento Infinity Fabric teve que ser violado e, por fim, isso levou a uma desaceleração, e não acelerando o sistema.
Nos processadores Ryzen 5000, parte da carga foi removida do barramento Infinity Fabric – agora ele não é responsável por conectar diferentes CCXs localizados no mesmo CCD, mas está apenas envolvido na comunicação entre os chips. Essa mudança permitiu que a AMD começasse a falar sobre o fato de que a memória em novos processadores em modo síncrono agora funcionará melhor. Deixe-me citar o guia de overclock da AMD:
«A experiência da AMD mostra que a janela de overclocking do Infinity Fabric do Ryzen 5000 mudou para cima, de forma que DDR4-4000 (e freqüência do Infinity Fabric de 2000 MHz) agora é possível para uma série de amostras de processadores. Em nossa opinião, o modo DDR4-4000 para os processadores da série 5000 é possível com a mesma freqüência possível para obter o DDR4-3800 na série 3000. Esses modos superiores são alcançáveis por CPUs selecionadas, mas não são garantidos em todos os casos e para todos os processadores. “
A AMD está indicando claramente que a operação síncrona de módulos DDR4, controlador de memória e Infinity Fabric agora é possível em uma frequência mais alta. No entanto, a reserva em relação aos espécimes selecionados é alarmante e parece que não parecia fácil. Os dois processadores – Ryzen 9 5900X e Ryzen 9 5950X, com os quais lidamos, não demonstraram a capacidade de trabalhar com DDR4-4000. Além disso, eles não apresentaram nenhuma melhora em termos de frequência máxima do Infinity Fabric em comparação com o que era antes.
Ambos os processadores ficaram completamente estáveis quando a frequência do Infinity Fabric foi aumentada para 1867 MHz, mas eles perderam a capacidade de funcionar já na próxima etapa – quando essa frequência foi aumentada para 1900 MHz. Assim, a frequência máxima de overclocking da memória racional em nosso caso permaneceu no modo DDR4-3733.
A partir dessa experiência, podemos concluir que, na realidade, o overclock de memória síncrona do Ryzen 5000 até mesmo para o estado DDR4-3800, para não mencionar os modos mais rápidos, permanece a mesma loteria de antes. Talvez agora a probabilidade de executar a memória em uma frequência mais alta do que DDR4-3733 seja maior, mas, infelizmente, não há garantia.
Além disso, os modos mais rápidos do que DDR4-3733, mantendo a sincronização com o Infinity Fabric, provavelmente não funcionarão no Ryzen 9 5900X e Ryzen 9 5950X, mas nos processadores da série inferior – Ryzen 7 5800X e Ryzen 5 5600X, que são baseados no mesmo chip CCD. Em tais processadores, o barramento Infinity Fabric é completamente livre de qualquer tráfego inter-core e é necessário exclusivamente para conectar o chip CCD ao chip I / O. É lógico supor que sua baixa carga será uma excelente base para aumentar a frequência. Mas é realmente assim, é muito cedo para dizer. Só uma coisa é certa: não faz sentido estocar propositadamente kits de memória de alta velocidade para sistemas baseados em novos processadores.
Neste ponto, surge a objeção de que a AMD ainda pode corrigir a situação com overclock de memória com novas versões do BIOS, como acontecia quase todas as vezes quando a próxima geração do Ryzen foi lançada. Mas eu gostaria de lembrá-lo que mudanças fundamentais no trabalho do Ryzen 5000 com memória não vieram de onde vir. O chip I / O, que hospeda o controlador DDR4 SDRAM, é herdado do Ryzen 3000, o que significa que os novos processadores em geral devem trabalhar com memória quase da mesma maneira que seus predecessores.
Resultado dos testes. achados
⇡#Descrição do sistema de teste e metodologia de teste
A decisão da AMD de fornecer Ryzen 9 5950X e Ryzen 9 5900X para o primeiro contato parece um truque militar, que é que eles são amplamente incomparáveis. Apenas este fabricante tem 12 e 16 núcleos compatíveis com a plataforma principal, enquanto o processador de consumidor mais antigo da Intel, o Core i9-10900K, oferece apenas 10 núcleos. Portanto, além do carro-chefe Comet Lake para este teste, tivemos que descobrir a plataforma Intel HEDT, dentro da qual existem propostas como o Core i9-10980XE de 18 núcleos e o Core i9-10920X de 12 núcleos. Esses processadores custam mais do que Ryzen sozinhos e exigem placas-mãe mais caras com memória quad-channel, e não são voltados para PCs de jogos. Mas nada pode ser feito, a posição agressiva da AMD no segmento de massa do mercado de processadores requer medidas extremas.
Além disso, incluímos o Ryzen 9 3950X nos testes junto com o Ryzen 9 3900X – processadores semelhantes ao Ryzen 9 5950X e Ryzen 9 5900X com 16 e 12 núcleos, mas construído na arquitetura Zen 2. A participação deles nos permitirá julgar se O Zen 3 é realmente um avanço tão significativo quanto a AMD o retrata?
Assim, o sistema de teste inclui os seguintes componentes:
Todos os processadores comparados foram testados com as configurações padrão dos fabricantes da placa-mãe. Isso significa que para as plataformas Intel, os limites de consumo de energia especificados nas especificações são ignorados e, em vez disso, as frequências máximas possíveis são usadas para obter o desempenho máximo. A grande maioria dos usuários opera processadores neste modo, uma vez que a inclusão de limites na dissipação de calor e consumo de energia na maioria dos casos requer configurações especiais do BIOS. Todos os processadores comparados foram testados com memória operando no modo DDR4-3600 com temporizações XMP.
O teste foi realizado no Microsoft Windows 10 Pro (v2004) Build 18363.476 usando o seguinte conjunto de drivers:
Descrição das ferramentas usadas para medir o desempenho da computação:
Benchmarks integrados:
Formulários:
Jogos:
Em todos os testes de jogos, o número médio de quadros por segundo, bem como 0,01-quantil (primeiro percentil) para valores de FPS são dados como resultados. O uso de 0,01-quantil em vez do FPS mínimo deve-se ao desejo de esclarecer os resultados de rajadas aleatórias de desempenho provocadas por razões não diretamente relacionadas à operação dos principais componentes da plataforma.
⇡#Benchmarks de desempenho
Verificar o desempenho dos processadores em testes complexos como o PCMark 10 é mais uma homenagem à tradição. Esses testes avaliam quão bem os sistemas resolvem tarefas comuns do usuário e fornecem um determinado resultado médio ponderado, caracterizando a velocidade dos processadores ao resolver tarefas de escritório, o que é difícil de contar como atividade típica para ofertas das classes Ryzen 9 5950X e Ryzen 9 5900X. No entanto, mesmo no PCMark 10, os processadores baseados na microarquitetura Zen 3 mostram sua força. Embora o Core i9-10900K de 10 núcleos neste teste tenha ultrapassado o Ryzen 9 3900X do Zen 2 de 12 núcleos da AMD, a situação mudou dramaticamente. Nos dois primeiros lugares nos diagramas abaixo – o novo Ryzen 9 5950X e Ryzen 9 5900X, que fala claramente das melhorias no desempenho do Zen 3 precisamente nas tarefas em que era anteriormente deficiente nos processadores AMD.
Os novos Ryzen 9 5950X e Ryzen 9 5900X também detêm a liderança no benchmark 3DMark Time Spy de quase jogos. O componente do processador deste teste tem otimizações para as atuais arquiteturas multithreaded, e nele o novo 16-core é fixado em primeiro lugar, o que não só supera o seu antecessor em 2%, mas também derrota o processador HEDT de 18 núcleos do concorrente.
⇡#Desempenho do aplicativo
Vamos começar com os ruins. Quando a AMD calculou o ganho de IPC, que afirma ser de 19% no Zen 3, escolheu um conjunto específico de aplicativos para avaliar, completamente diferente dos aplicativos que usamos para teste. Como resultado, ao comparar Ryzen 9 5950X e Ryzen 9 3950X em tarefas de uso intensivo de recursos, não vemos ganhos tão impressionantes como a AMD prometeu, embora o novo Ryzen 9 5950X seja executado em uma frequência mais alta em nossos testes em comparação com Ryzen 9 3950X. A vantagem média dos falantes nativos da arquitetura Zen 3 sobre o Zen 2 é de cerca de 13%, o que, no entanto, também é muito bom.
O lado positivo dos novos produtos da AMD é que eles contornam com segurança todas as ofertas concorrentes da Intel e com uma pontuação completamente devastadora. O Ryzen 9 5900X de 12 núcleos acabou por ser mais rápido que o Core i9-10900K em uma média de 30%, enquanto o Ryzen 9 5950X de 16 núcleos contorna com segurança o Intel de 18 núcleos, superando seu desempenho em cerca de 20%. Em outras palavras, os processadores Intel não têm chance em aplicativos que consomem muitos recursos: a microarquitetura Skylake se tornou completamente obsoleta.
Tudo isso significa que o Ryzen 9 5950X e o Ryzen 9 5900X são os melhores processadores profissionais e amadores de conteúdo digital disponíveis hoje em um ecossistema tradicional. Apenas representantes da família Threadripper podem competir com eles, mas seu custo é muito mais alto.
Renderização:
Processamento de fotos:
Trabalhar com vídeo:
Transcodificação de vídeo:
Compilação:
Arquivamento:
Xadrez:
Mineração:
⇡#Desempenho de jogo. Testes 1080p
E é aí que está o verdadeiro calor! A reestruturação do CCX é exatamente o que faltou aos processadores Ryzen nas primeiras três gerações. É por isso que seu desempenho nos jogos tem causado críticas constantes. Agora o problema foi corrigido e com tanto sucesso que a taxa de quadros na resolução FullHD saltou imediatamente em 25-30% ao mudar do Zen 2 para o Zen 3. E isso imediatamente coloca os processadores Ryzen 5000 em uma posição que é definitivamente adequada para sistemas de jogos.
Ainda não vimos como os representantes mais jovens desta linha se saem em jogos, mas o Ryzen 9 5950X e o Ryzen 9 5900X parecem muito bem. Por exemplo, o mesmo Ryzen 9 5900X, de acordo com os resultados dos testes em um conjunto de 12 jogos, demonstra alguma superioridade em FPS médio e mínimo sobre o Core i9-10900K, que ainda era considerado o melhor CPU para jogos.
No entanto, para ser justo, deve-se notar que ainda não há vantagem em grande escala, como no caso de aplicativos que usam muitos recursos. Os novos processadores da AMD são apenas marginalmente melhores do que o Core i9-10900K, superando-o em sete de doze jogos. Isso significa que o Ryzen 9 5900X não conseguiu enviar o Core i9-10900K para um nocaute completo. Para conjuntos de jogos de desempenho, você pode escolher um ou outro CPU, e a opção Intel pode de repente se tornar mais atraente devido ao preço mais baixo.
Ao longo do caminho, deve-se acrescentar que o aumento declarado da AMD no IPC nos processadores Zen 3 em 19% foi obviamente calculado com base em aplicativos de trabalho e jogos. Na verdade, em aplicativos que consomem muitos recursos, o ganho acabou sendo menor do que esse valor e, em jogos – mais.
⇡#Desempenho de jogo. Testes em 2160p
Se você escolher o melhor processador para sistemas de jogos focados em trabalhar com resolução Ultra HD, então neste caso as diferenças entre Ryzen 9 5950X, Ryzen 9 5900X e Core i9-10900K são quase completamente apagadas, pelo menos se o sistema tiver uma placa de vídeo GeForce. RTX 3080. No entanto, a inconsistência em jogos dos processadores Intel HEDT, bem como o atraso em relação aos novos processadores AMD Ryzen da geração anterior, são bem rastreados mesmo aqui.
⇡#Consumo de energia
Ryzen 9 5950X e Ryzen 9 5900X são colocados no mesmo pacote térmico que seus predecessores – Ryzen 9 3950X e Ryzen 9 3900X: todos eles têm um consumo de energia fortemente limitado de 142 W e quando é alcançado, a frequência é simplesmente reiniciada. Portanto, nenhuma mudança perceptível no consumo de energia ocorreu ao mudar para a microarquitetura Zen 3, no entanto, em geral, os sistemas baseados no Ryzen 9 5950X e Ryzen 9 5900X são ligeiramente mais econômicos em comparação com sistemas semelhantes baseados no Ryzen 9 3950X e Ryzen 9 3900X sob carga multiencadeada, mas um pouco mais faminto de energia no caso de trabalho de thread único.
E isso significa que Ryzen 9 5950X e Ryzen 9 5900X superam claramente os processadores Intel em termos de desempenho específico por watt, uma vez que o consumo de processadores de 14 nm para o LGA 1200 e LGA 2066 é visivelmente maior com desempenho significativamente inferior.
Os gráficos abaixo permitem avaliar tudo isso com clareza. Eles mostram o consumo total dos sistemas (sem monitores) com os respectivos processadores, medido “após” a alimentação e é a soma do consumo de energia de todos os componentes envolvidos no sistema. A eficiência da fonte de alimentação em si não é levada em consideração neste caso.
⇡#Achados
Zen 3 é poderoso! Em princípio, nada mais poderia ter sido adicionado a isso, porque o ganho de desempenho alcançado pela AMD na quarta iteração do desenvolvimento da microarquitetura Zen acabou sendo fenomenalmente alto: o aumento no IPC em 19%, sobre o qual os representantes da empresa falaram em apresentações preliminares, de forma alguma exagero. Parece que o desenvolvimento dos núcleos da geração Zen passou por overclock e overclock por vários anos, e agora a AMD finalmente “se afogou por completo”.
Mas se abandonarmos belas metáforas, então podemos dizer que a AMD no Zen 3 começou a fazer o que vinha pedindo há muito tempo e finalmente deu passos concretos para combater o principal gargalo de sua microarquitetura – altas latências geradas pela própria ideia de modular construir um processador a partir de complexos CCX separados. E assim que os engenheiros da AMD decidiram aumentar o tamanho desta unidade base, muitos problemas desapareceram imediatamente do campo de visão, e o desempenho literalmente disparou, especialmente a julgar por programas que são críticos para latências de processador interno (aqui estamos falando principalmente de jogos).
Como resultado, os processadores Ryzen 5000 construídos na arquitetura Zen 3 finalmente e irrevogavelmente contornaram as soluções Intel Core concorrentes, cuja arquitetura estava irremediavelmente travada em 2015. Até recentemente, a Intel era capaz de manter suas ofertas no caminho certo, apelando para o desempenho de jogos que seus processadores realmente mantiveram em um bom nível ao longo dos anos, graças a um barramento em anel de processador interno altamente eficiente. Mas o Ryzen 5000 com arquitetura Zen 3, em que o barramento Infinity Fabric, que tem um efeito negativo no desempenho dos jogos, deixou de desempenhar um papel fundamental, priva o “azul” do último trunfo.
Na verdade, chegamos à conclusão de que o Ryzen 5000 é o CPU mais rápido para desktop hoje, sem quaisquer ressalvas significativas. Obviamente, estamos longe de pensar que nos comentários deste artigo uma lista considerável de razões pelas quais a AMD ainda “falhou” não aparecerá nos comentários. E objetivamente, o Ryzen 5000 tem certas desvantagens, mas quem não tem? Por exemplo, é bem possível referir-se ao fato de que o controlador de memória dos novos processadores AMD não recebeu suporte total para tipos de alta velocidade de DDR4 SDRAM, e as frequências alcançadas pelo novo Ryzen durante o overclocking continuam a inspirar algum desânimo. Mas tendo como pano de fundo o que aconteceu com o desempenho específico, tudo isso são apenas pequenos problemas, que não devem estragar a impressão geral da chegada triunfante de uma versão nova e correta da arquitetura Zen no mercado.
Talvez haja apenas duas coisas que podem confundir a impressão do Ryzen 5000 na percepção da massa: seu custo relativamente alto e problemas de disponibilidade no varejo. Mas você precisa entender que ambos são consequências de um salto qualitativo dado pela AMD. A série Ryzen 5000 não precisa ser barata: eles são bons o suficiente para que os entusiastas de alto desempenho provavelmente estejam dispostos a comprá-los por um preço mais alto. E o fato de que a demanda por esses novos itens excede a oferta serve como uma confirmação clara de que a AMD não perdeu e lançou um produto de alta qualidade exigido sem ir além do limite com seu custo. Afinal, o mercado de processadores para PC não é um monopólio, e os compradores que acham que o Ryzen 5000 é caro devem ser aconselhados a optar pela antiga série Ryzen 3000, que ainda está no mercado, ou pelos processadores Intel Core. Embora, em nossa opinião, o Ryzen 9 5900X e o Ryzen 9 5950X testados nesta análise valham claramente o seu dinheiro, e o mesmo provavelmente será verdade para os outros dois representantes do modelosérie, que conheceremos um pouco mais tarde.
Resumindo a linha final, tudo o que resta é dar ao Ryzen 9 5950X e ao Ryzen 9 5900X nosso prêmio de assinatura – a medalha Escolha do Editor. Embora outros emblemas de distinção possam caber aqui: tanto a medalha pragmática “Por Inovação e Design”, e a avaliação mais emocional de “Hardcore”.
O julgamento de aquisição do Twitter de Elon Musk em 2022 está em andamento, e…
A empresa aeroespacial Blue Origin conduziu com sucesso seu décimo voo suborbital, durante o qual…
Após uma série de atrasos, a Microsoft começou a lançar seu recurso AI Recall no…
A ZTE lançou um smartphone barato Nubia V70 Design. Em alguns mercados, o dispositivo será…
Baldur's Gate 3 está repleto de situações em que o sucesso de toda a missão…
Malcolm Merda, e. Ó. O Senhor do Norte, estava muito cansado de enforcar e esquartejar…