Como escolher e configurar a memória para Ryzen 5000 de modo a não desperdiçar 15% FPS do nada

O lançamento da primeira geração de processadores Ryzen no mercado em 2017 desencadeou o surgimento de vários materiais na escolha e configuração certas de RAM. Também escrevemos esses artigos, porque naquela época era realmente difícil para os usuários entender a seleção de módulos DDR4 SDRAM para novos processadores AMD. O controlador de memória do primeiro Ryzen era muito caprichoso e estava longe de ser os requisitos mais óbvios para os módulos SDRAM DDR4 usados, além disso, várias questões surgiram ao configurá-los.

Mas agora os processadores Ryzen de terceira e quarta gerações estão no mercado, e esses CPUs, baseados nas microarquiteturas Zen 2 e Zen 3, ficaram muito melhores e mais fáceis em termos de trabalho com memória. As listas de módulos DDR4 SDRAM recomendados se foram; não há mais quadros rígidos para frequência e outras configurações do subsistema de memória. No entanto, tudo isso não significa de forma alguma que a seleção de memória para Ryzen agora possa ser ignorada.

Ao contrário, estamos diante de uma situação exatamente oposta. O fato é que a AMD conseguiu aumentar significativamente a velocidade de seus processadores nos últimos anos. Eles aumentaram o desempenho específico e as frequências de clock. Como mostramos em uma postagem de blog recente, o Ryzen 7 5800X de oito núcleos de hoje supera o carro-chefe da primeira geração Ryzen 7 1800X em 69% em aplicativos e 52% em jogos. Ou seja, os Ryzen modernos tornaram-se capazes de processar mais de uma vez e meia mais dados do que seus ancestrais recentes, e isso obviamente aumentou sua necessidade de memória mais rápida.

Infelizmente, o desenvolvimento da RAM tradicionalmente fica atrás do progresso nas arquiteturas de processador. Tanto o antigo quanto o novo Ryzen, apesar da diferença significativa em seu desempenho, funcionam com a mesma SDRAM DDR4, então a única maneira de expandir o canal de acesso a dados para um processador moderno (sem alterações significativas na arquitetura do sistema) é aumentar a frequência de memória com otimização de latência associada … Algum movimento ao longo desse caminho está realmente acontecendo, mas não estamos falando de avanços qualitativos: por exemplo, se falarmos sobre Ryzen, então em quatro anos a frequência da memória que eles suportam oficialmente cresceu apenas 20% – de DDR4 -2666 a DDR4-3200.

O fato de que o aumento no desempenho do subsistema de memória fica atrás do aumento na velocidade dos processadores é reconhecido pela própria AMD e está fazendo grandes esforços para preencher essa lacuna. Para isso, os processadores Ryzen 3000 dobraram a quantidade de cache L3, que até recebeu o nome próprio Game Cache. E exatamente pelo mesmo motivo, a AMD agora está considerando a possibilidade de triplicar o cache L3 nos processadores Ryzen 5000. Ficamos sabendo desses planos apenas recentemente, quando a AMD anunciou a tecnologia 3D V-Cache na Computex 2021, que permite adicionar 64 MB L3 adicionais a um chip de processador de “segunda camada” existente graças à edição tridimensional.

Esse desejo de aumentar a quantidade de memória cache do terceiro nível é explicado precisamente pelo desejo da AMD de minimizar o tempo de inatividade dos núcleos do processador devido à espera dos dados que surgem devido ao desempenho insuficiente do subsistema de memória. E o fato de que esta abordagem é realmente aplicável pode ser visto claramente pelo efeito obtido com o aumento do cache L3. Por exemplo, a própria AMD promete que a adição de um chip V-Cache 3D adicional aos promissores processadores Ryzen 5000 aumentará seu desempenho em jogos em uma média de 15%.

Enquanto isso, os processadores Ryzen 5000 não têm um cache L3 gigante, a escolha correta de RAM em sistemas Socket AM4 continua a fazer uma contribuição significativa para o desempenho geral. E podemos confirmar esta tese com um argumento muito convincente: de acordo com nossos testes, o desempenho em jogos do Ryzen 7 5800X com memória DDR4-2666 regular e com DDR4-3800 ajustado difere em uma média de 20-25%.

Isso significa que, se você não deseja prejudicar artificialmente o desempenho de um processador AMD moderno, não deve se preocupar menos com a seleção e o ajuste de seu subsistema de memória. Caso contrário, as perdas de desempenho podem anular todas as vantagens da microarquitetura moderna e até mesmo causar decepção na plataforma AMD.

Para simplificar a tarefa de selecionar o subsistema de memória ideal para os processadores Ryzen 5000, decidimos lançar este material, no qual coletamos as recomendações mais importantes sobre a melhor forma de selecionar a memória e como obter sua operação mais eficiente no sistema. Falaremos sobre a classificação dos módulos SDRAM DDR4, suas frequências e latências, sobre os modos síncrono e assíncrono, bem como a frequência do controlador de memória e do barramento Infinity Fabric.

⇡#Por que este artigo usa memória Crucial quando não fala sobre isso

O sortimento de RAM, apresentado nas prateleiras das lojas, é muito diversificado e é muito difícil navegar nele. Além disso, o problema é agravado pelo fato de que os fabricantes de memórias não comunicam todas as características de seus produtos, ocultando parâmetros-chave importantes. Nas especificações publicamente disponíveis para módulos DDR4 SDRAM, apenas três características são geralmente indicadas: sua frequência, tensão de operação e temporizações primárias.

Porém, para um ajuste ótimo do subsistema de memória, é muito mais importante ter outras informações – com base em quais chips esses ou aqueles módulos são construídos, já que isso afeta diretamente a possibilidade de seu overclocking e ajuste flexível. As opções ideais para completar sistemas construídos em processadores Ryzen 5000 são módulos com chips Samsung B-die ou Micron Rev. E – eles escalam bem em frequência e acabam sendo muito suscetíveis a mudanças de tempo.

Mas o mercado está inundado com uma massa de outras variantes de módulos DDR4 SDRAM, por exemplo, com vários chips Hynix, que são muito piores em termos de suas características de consumo. E o que é especialmente triste é que esses chips são freqüentemente encontrados em módulos oferecidos por marcas conhecidas de overclocking, como Kingston, Corsair ou mesmo G.Skill.

Nessa situação, podemos recomendar a opção por propostas comprovadas, nas quais o uso de chips “bons” seja conhecido com antecedência e onde a probabilidade de substituição inesperada de componentes de hardware seja mínima. É por esses critérios que escolhemos a memória Crucail Ballistix. Esta marca pertence à Micron e todos os módulos desta marca relacionados com a versão U4 (que está explicitamente indicado no final da etiqueta) têm garantia de utilização de chips com overclock e flexíveis Micron Rev. E.

Em testes reais, usamos várias variantes dos módulos Crucail Ballistix ao mesmo tempo, mas todos eles mostraram aproximadamente o mesmo comportamento devido aos chips Micron Rev. E. Pode-se esperar que essa memória tenha um overclock de pelo menos 3800-4000 MHz e a capacidade de trabalhar neste estado com o tempo base CL16 (superestimando um pouco o parâmetro RCDRD).

Uma alternativa aos módulos Crucail Ballistix para uso em sistemas baseados em Ryzen 5000 pode ser a memória em chips Samsung B-die. Por exemplo, agora Patriot oferece uma ampla gama de tais módulos. Comparado ao Crucail Ballistix, os módulos baseados em chips Samsung B-die podem operar em latências mais agressivas e, portanto, são capazes de fornecer um desempenho ligeiramente melhor. No entanto, eles também são mais caros, por isso nossa simpatia permanece do lado da memória com os chips Micron Rev. E.

Ao mesmo tempo, tudo o que será discutido neste artigo é verdadeiro para qualquer tipo de módulo DDR4 SDRAM. O resto da história será construído em torno dos princípios gerais do subsistema de memória dos processadores da série Ryzen 5000. E como essas regras são definidas no lado do processador, os módulos de memória específicos não são tão importantes aqui.

⇡#Descrição do sistema de teste e metodologia de teste

Fizemos todos os testes para este material em um sistema baseado em um processador Ryzen 7 5800X de oito núcleos. Esta CPU está amplamente disponível comercialmente e, junto com o Ryzen 5 5600X, é ótima para sistemas de jogos. Além disso, no contexto de teste de memória, também é bom por se basear em um complexo CCX, o que significa que quando os núcleos do processador trabalham com dados, não há atrasos adicionais devido à heterogeneidade da topologia, como em o Ryzen 9 5900X de 12 e 16 núcleos e o Ryzen 9 5950X.

O sistema de teste usou componentes do seguinte conjunto:

  • Processador: AMD Ryzen 7 5800X (Vermeer, 8 núcleos + SMT, 3,8-4,7 GHz, 32 MB L3).
  • Refrigerador de CPU: LSS EKWB personalizado.
  • Placa-mãe: ASUS ROG Crosshair VIII Hero (soquete AM4, AMD X570).
    • Crucial Ballistix RGB BL16G36C16U4R (16 Гбайт DDR4-3600 SDRAM, 16-18-18-38);
    • Crucial Ballistix RGB BL8G36C16U4BL (8 Гбайт DDR4-3600 SDRAM, 16-18-18-38).
  • Placa de vídeo: NVIDIA GeForce RTX 3090 Founders Edition (GA102, 1395-1695 / 19500 MHz, 24 GB GDDR6X 384 bits).
  • Subsistema de disco: Intel SSD 760p 2 TB (SSDPEKKW020T8X1).
  • Descrição: Thermaltake Toughpower DPS G RGB 1000W de titânio (80 Plus Titanium, 1000 Вт).

O teste foi realizado no Microsoft Windows 10 Pro (20H2) Build 19042.572 usando o seguinte conjunto de drivers:

  • Driver do chipset AMD 2.17.25.506;
  • Driver NVIDIA GeForce 466.47.

Descrição das ferramentas usadas para medir o desempenho da computação:

Benchmarks sintéticos:

  • AIDA64 Engineer 6.33.5700 – тест Cache and Memory Benchmark.

Formulários:

  • 7-zip 02.21 – testando a velocidade de arquivamento. O tempo gasto pelo arquivador para compactar um diretório com vários arquivos com um volume total de 3,1 GB é medido. O algoritmo LZMA2 e a taxa de compressão máxima são usados.
  • Adobe Photoshop Lightroom Classic 10.2 – teste de desempenho ao processar em lote uma série de imagens em formato RAW. O cenário de teste inclui pós-processamento e exportação de JPEG com resolução 1920 × 1080 e uma qualidade máxima de duzentas imagens RAW de 26MP obtidas com uma câmera digital Fujifilm X-T4.
  • Adobe Premiere Pro 2021 15.2.0 – teste de desempenho para edição de vídeo não linear. Isso mede o tempo de renderização para o YouTube 4K de um projeto contendo filmagem HDV 2160p30 com vários efeitos aplicados.
  • Corona 1.3 – testando a velocidade de renderização usando o renderizador de mesmo nome. O aplicativo padrão Corona 1.3 Benchmark é usado para medir o desempenho.
  • X264 r3059 – testando a velocidade de transcodificação de vídeo para o formato H.264 / AVC. Para avaliar o desempenho, o arquivo de vídeo AVC original [protegido por e-mail] é usado, que tem uma taxa de bits de cerca de 42 Mbps.

Jogos:

  • Cyberpunk 2077. Разрешение 1920 × 1080: Quick Preset = Ray Tracing – Ultra.
  • Far Cry New Dawn. Разрешение 1920 × 1080: Qualidade gráfica = Ultra, Texturas HD = Ligado, Anti-Aliasing = TAA, Desfoque de movimento = Ligado.
  • Hitman 3. Разрешение 1920 × 1080: Super Sampling = 1.0, Nível de Detalhe = Ultra, Qualidade da Textura = Alta, Filtro da Textura = Anisotrópico 16x, SSAO = Ultra, Qualidade da Sombra = Ultra, Qualidade de Reflexão dos Espelhos = Alta, Qualidade SSR = Alta, Sombreamento de taxa variável = qualidade.
  • Shadow of the Tomb Raider. Разрешение 1920 × 1080: DirectX12, Predefinição = Mais alta, Anti-Aliasing = TAA.
  • Uma saga de guerra total: Troy. Разрешение 1920 × 1080: DirectX 12, qualidade = ultra, tamanho da unidade = extremo.

Em todos os testes de jogos, o número médio de quadros por segundo, bem como 0,01-quantil (primeiro percentil) para valores de FPS são dados como resultados. O uso de 0,01-quantil em vez do FPS mínimo deve-se ao desejo de esclarecer os resultados de rajadas aleatórias de desempenho provocadas por razões não diretamente relacionadas à operação dos principais componentes da plataforma.

⇡#O número e o tamanho dos módulos de memória e por que dezesseis é melhor do que oito

A primeira grande questão sobre a memória que terá de ser feita ao montar um sistema baseado em um processador Ryzen será sobre seu volume. Todo mundo já está acostumado com o fato de que um sistema moderno requer 16 GB de memória, quantidade suficiente para a grande maioria dos jogos e programas. No nosso site, existe até um estudo especial a este respeito, que demonstra que os jogos mais exigentes não ocupam mais do que 12 GB de memória. No entanto, alguns usuários ainda acreditam que é melhor ter 32 GB no sistema – isso dará alguma margem para o futuro e pode permitir que você trabalhe sem problemas em vários aplicativos que consomem muitos recursos em execução ao mesmo tempo.

No entanto, na realidade, instalar 32 GB em um sistema não é tanto uma escolha a favor de um grande volume, mas a favor de um desempenho superior. A questão é que um subsistema de memória de 32 GB geralmente terá mais classificações (bancos de memória) do que um subsistema de 16 GB, e isso permitirá que o processador acesse os dados com mais eficiência.

Funciona assim. Os processadores da série Ryzen têm um controlador SDRAM DDR4 de canal duplo com largura total de 128 bits, mas cada canal de 64 bits pode usar um, dois ou quatro bancos de memória independentes, que são intercalados para acelerar as solicitações. Assim, do ponto de vista do desempenho, é melhor ter um número maior desses bancos – isso reduzirá o tempo de inatividade do controlador de memória à espera dos dados.

Os módulos DDR4 usuais de 8 GB quase sempre representam um banco e, portanto, são chamados de ponto a ponto. Eles podem ser facilmente diferenciados colocando todos os chips em um lado do PCB. E para obter a alternância de bancos nos canais do controlador de memória com a ajuda dessas tiras de memória de 8 GB, deve haver pelo menos quatro módulos no sistema – dois para cada canal.

Os módulos DDR4 com um volume de 16 GB, ao contrário, em sua maioria consistem em dois bancos ao mesmo tempo e, portanto, são chamados de dual-rank. Sua diferença fundamental dos módulos de 8 GB é perceptível a olho nu: os chips de memória neles estão localizados em ambos os lados da placa de circuito impresso, estes são apenas dois bancos diferentes. Nesse sentido, um módulo de 16 GB é análogo a um par de módulos de 8 GB, e a instalação de até duas tiras de 16 GB no subsistema de memória já permitirá que o controlador de memória Ryzen habilite a rotação dupla do banco. Além disso, se quatro módulos de 16 GB forem usados ​​em um sistema com Ryzen, o número de bancos em cada canal aumentará para quatro, o que permitirá que o controlador de memória obtenha um desempenho ainda maior.

No entanto, é necessário fazer uma reserva que na natureza existem módulos ponto a ponto de 16 GB, construídos em 16 gigabit, e não 8 chips de dois gigabit. Essas ofertas agora são encontradas entre os kits de memória para overclocking de alta velocidade e, naturalmente, oferecem desempenho inferior em comparação com alternativas de classificação dupla, embora as frequências sejam altas. No entanto, esses módulos não são tão difundidos e o usuário sempre pode descobrir facilmente se está lidando com um módulo de duas posições ou ponto a ponto. Isso pode ser determinado colocando os chips em dois ou em um lado da placa de circuito impresso e usando utilitários de diagnóstico. Por exemplo, o número de classificações (bancos) em cada módulo é exibido pelo popular programa CPU-Z.

O número de bancos ativos nos canais de memória é um parâmetro muito importante do subsistema de memória em relação aos processadores Ryzen 5000. Decidimos começar com isso por um motivo: a capacidade de habilitar a intercalação de bancos nos canais de memória permite que você obtenha uma aumento de desempenho, e a configuração “dois módulos de 8 GB”, que não implica nenhuma alternância, é claramente uma opção de compromisso, principalmente do ponto de vista de desempenho.

Tudo isso é fácil de fazer backup com os resultados dos testes. Abaixo estão os resultados da medição de desempenho de um sistema baseado em Ryzen 7 5800X, equipado com módulos DDR4-3600 com as mesmas temporizações 16-18-18-36, mas com diferentes capacidades e, consequentemente, classificação. Comparamos as opções 2 × 8 GB, 4 × 8 GB, 2 × 16 GB e 4 × 16 GB e, além disso, para completar, adicionamos uma versão de canal único obtida usando um módulo de 16 GB dual-rank.

 

 

A largura de banda sintética e os testes de latência indicam que a diferença entre memória peer e dual-peer em canais não é tão grande. Algumas discrepâncias perceptíveis nos indicadores podem ser vistas apenas em testes de cópia, então começa a parecer que toda a teoria sobre a vantagem dos módulos de memória de 16 GB não passa de um mito. Mas não tenha pressa.

 

 

Em testes de desempenho em aplicativos que trabalham ativamente com grandes quantidades de dados, verifica-se que a memória de duas classificações pode fornecer um aumento significativo no desempenho. Por exemplo, no Archiver ou Lightroom, uma configuração de 2×16 GB é mais rápida do que 2×8 GB em quase 20%. E mesmo em aplicativos que respondem mal ao desempenho, a memória dual-rank ainda parece melhor. Mas a configuração de 4 × 16 GB, quando há quatro bancos de memória em cada canal de memória, não é mais tão eficaz. Mesmo em aplicativos sensíveis, o aumento em comparação com a versão de duas classificações 2 × 16 GB atinge apenas 2-3%. Em outras palavras, a melhor opção são os módulos two-rank, o que também é confirmado por testes de jogo.

 

 

Nem todos os jogos reagem à classificação da memória da mesma maneira, mas na maioria dos casos os módulos de 16 GB oferecem uma vantagem de 10%. Se não dois, mas quatro desses módulos estão instalados no sistema, então você pode contar com um aumento adicional na taxa de quadros ao nível de 1-2%. Ao longo do caminho, notamos que a opção de configuração 4 × 8 GB é quase equivalente em desempenho à instalação de um par de módulos de 16 GB, o que é bastante natural, já que em ambos os casos existem dois bancos de memória em cada canal de memória.

Mas uma configuração de canal único oferece desempenho ainda pior do que 2 × 8 GB, portanto, vale a pena recorrer ao uso de um módulo no subsistema de memória, mesmo que tenha uma organização de duas categorias, apenas como último recurso.

Ao final da conversa sobre os ranks de memória, deve-se enfatizar que estamos falando exclusivamente de representantes da família Ryzen 5000, cujo controlador de memória mudou significativamente em comparação com seus antecessores. Com os processadores Ryzen de primeira ou segunda geração, não era recomendado o uso de memória dual, já que tais módulos carregavam o controlador de memória mais pesadamente e simplesmente não podiam receber altas frequências. Mas no Ryzen 5000, esse problema não existe: esses processadores funcionam igualmente bem com memória ponto a ponto e memória dupla, demonstrando desempenho visivelmente superior com a última.

⇡#Frequência de memória e o paradoxo DDR4-4000

A frequência da memória é o parâmetro mais óbvio. Sem nenhum cálculo adicional, fica claro que quanto mais alta a frequência dos módulos DDR4, maior sua largura de banda e mais rápido o processador pode receber dados da memória. Esta tese quase não necessita de esclarecimentos adicionais, embora, a rigor, a regra “mais é melhor” nem sempre funcione aqui.

Mas voltaremos a isso mais tarde, mas o que pode levantar questões ainda antes é alguma inconsistência entre as especificações oficiais e o que ocorre na prática. As especificações dos processadores da série Ryzen 5000 indicam que a memória máxima que eles podem suportar é DDR4-3200, e essa frequência é garantida apenas ao usar dois DIMMs. Ao adicionar um segundo par de módulos, a frequência máxima da memória, de acordo com a especificação, é reduzida para DDR4-2933 ou mesmo para DDR4-2666, dependendo de quais módulos estão em questão.

No entanto, essas instruções não devem ser tomadas como postulados irrefutáveis: a própria AMD diz que frequências mais altas são possíveis, apenas casos em que o usuário não trabalha a memória em uma frequência mais alta que DDR4-3200 não são considerados garantia. Na realidade, o controlador de memória do processador Ryzen 5000 tem flexibilidade e compatibilidade – você pode usar memória com esta CPU, cuja frequência é significativamente mais alta do que a barra definida na especificação. Por exemplo, o registro de frequência de memória atual para os processadores da família Ryzen 5000 chega a DDR4-5208, e o conhecido fabricante de módulos de memória para overclocking G.Skill produz módulos DDR4-4000 seriais que são projetados para serem instalados especificamente em configurações de soquete AM4.

Em outras palavras, com os processadores Ryzen 5000, você pode usar memória com uma frequência maior que DDR4-3200, e, além disso, é diretamente recomendado fazer isso, já que seu uso tem um efeito positivo no desempenho.

O quanto a memória mais rápida pode afetar o desempenho pode ser visto em benchmarks em que comparamos as configurações de um Ryzen 7 5800X rodando com um par de módulos DDR4-2666, DDR4-3200, DDR4-3600, DDR4-3800 e DDR4-4000. Em todos os casos, exceto no último, o mesmo esquema de temporização 16-18-18-38 foi usado para o subsistema de memória. Para operação estável de DDR4-4000 neste esquema, foi necessário enfraquecer a temporização RCDRD em um e, além disso, abandonar a temporização síncrona do controlador de memória, que será descrito em detalhes abaixo.

 

 

Testes de largura de banda sintética mostram uma lacuna de quase 40% entre DDR4-2666 e DDR4-3800, bem como uma vantagem de 15% de DDR4-3800 sobre DDR4-3200. Somado a isso está a diminuição quase igualmente perceptível na latência prática ao alternar para tipos de memória mais rápidos.

 

 

A vantagem da memória rápida é bastante clara nos aplicativos. Em tarefas onde o acesso rápido à memória é realmente importante, o DDR4-3800 pode obter um ganho de até 7% em comparação com um sistema semelhante, mas com o DDR4-3200.

 

 

Reage perceptivelmente ao aumento da memória e das frequências de jogo. Mudar de DDR4-3200 para DDR4-3800 traz um aumento no FPS, chegando em alguns casos a 8% (ou 5% em média). Mas uma imagem muito mais convincente é obtida se compararmos DDR4-2666 com a memória mais rápida – aqui é legítimo dizer que a memória de baixa frequência pode reduzir o desempenho em jogos em 15 ou até 20%.

Mas é muito cedo para colocar um fim, já que permanece a dúvida sobre o desempenho do teste Ryzen 7 5800X com DDR4-4000. Parece que essa memória deve fornecer um desempenho ainda maior nos testes, mas nos diagramas vemos a imagem oposta. Uma breve explicação desse paradoxo é que para DDR4-4000 nos processadores da família Ryzen 5000, você deve ativar o modo assíncrono do controlador de memória, o que leva a um aumento perceptível nas latências. Mas vale a pena falar sobre esse fenômeno com mais detalhes – a próxima seção será dedicada à sincronização das frequências internas do Ryzen 5000, associadas ao funcionamento do controlador de memória.

Página 2

⇡#Mágica de sincronização: frequência do controlador de memória e barramento Infinity Fabric

Para entender o que há de errado com o modo DDR4-4000 (e mais rápido) no Ryzen 5000, você precisa cavar um pouco mais fundo em suas partes internas. Os processadores desta família são montados a partir de dois tipos de chips – chips CCD de 8 núcleos de 7 nm, que contêm núcleos de computação, e um chip IOD de 12 nm, que abriga controladores de memória, PCIe 4.0 e algumas outras interfaces externas. Os chips são conectados uns aos outros por um barramento Infinity Fabric especial de 32 bits, que opera em sua própria frequência independente.

Como o controlador de memória Ryzen está fisicamente desconectado dos núcleos do processador, ele também tem sua própria frequência de operação. E, no total, tudo isso leva ao fato de que a velocidade do subsistema de memória é determinada por três frequências: a frequência dos módulos de memória, a frequência do controlador de memória e a frequência do barramento Infinity Fabric conectando o controlador com o núcleos do processador e cache L3.

Naturalmente, o desempenho máximo de todo este complexo é alcançado quando o Infinity Fabric, o controlador de memória e a própria memória operam de forma síncrona, ou seja, na mesma frequência, mas isso não pode ser alcançado por nenhuma variante de módulos DDR4 SDRAM. Mas a AMD pelo menos tentou garantir que a regra de clocking síncrono fosse observada em tantos casos quanto possível. E se o sistema usar DDR4-3600 ou memória de velocidade inferior, a sincronização é realizada automaticamente. Mas para módulos de memória mais rápidos, as coisas acontecem de forma diferente.

A tabela acima mostra como o controlador de memória e as frequências de barramento do Infinity Fabric se comportam ao passar pelo modo DDR4-3600. Em modos mais rápidos, a frequência do Infinity Fabric para de crescer após a frequência da memória e permanece em torno de 1800 MHz, ativando a assincronia.

Quanto ao controlador de memória, sua frequência está relacionada à frequência da memória, mas pode operar tanto na frequência da memória quanto na metade de sua frequência. Ao mesmo tempo, há mais uma condição: sua frequência não pode ser superior à frequência do Infinity Fabric. Como resultado, se a frequência do Infinity Fabric ficar fora de sincronia com a frequência da memória, o controlador de memória será forçado a entrar no modo de meia frequência mais lento. Como resultado, temos duas opções fundamentalmente diferentes: ou tudo funciona de forma síncrona e tudo está bem, ou todas as frequências associadas ao subsistema de memória saem do pacote, e isso gera atrasos adicionais e bastante significativos. É por causa deles que observamos uma diminuição no desempenho do Ryzen 7 5800X quando instalado em um sistema DDR4-4000.

No entanto, há mais uma nuance importante. O link de frequência descrito acima é o mecanismo padrão para sistemas baseados no processador Ryzen 5000. Na realidade, o usuário tem acesso tanto para alterar manualmente a frequência do Infinity Fabric quanto para alterar os modos de relógio do controlador de memória – de forma síncrona com módulos DDR4 SDRAM ou em meia frequência.

 

Como resultado, o próprio usuário pode tentar habilitar o modo síncrono produtivo para opções de memória mais rápidas do que DDR4-3600. E em alguns casos realmente funciona. Portanto, graças ao ajuste manual de frequências com Ryzen 5000, não apenas DDR4-3600, mas também DDR4-3800 mais rápido podem trabalhar de forma síncrona (que usamos para testes na seção anterior). Nesse caso, é suficiente fixar manualmente a frequência do Infinity Fabric em 1900 MHz, e isso na maioria das vezes funcionará sem problemas. No entanto, para opções de memória mais rápidas, como DDR4-4000, é quase impossível obter estabilidade no modo síncrono.

Quando a AMD anunciou os processadores da família Ryzen 5000, prometeu que, por uma boa coincidência, seria capaz de funcionar sincronizadamente com DDR4-4000, ou seja, argumentou-se que a frequência de 2000 MHz para o barramento Infinity Fabric é bastante real.

No entanto, essa declaração não passou no teste da vida. É possível definir a frequência do Infinity Fabric e do controlador de memória para 2.000 MHz, mas com essas configurações, o sistema operacional começa a registrar vários erros WHEA (Windows Hardware Error), que estão associados à distorção dos dados transmitidos pelo Infinity Tecido. A maioria desses erros é corrigida pelos mecanismos do Windows 10, mas alguns deles podem levar a uma falha do sistema e ao aparecimento de “telas azuis”. Em outras palavras, um sistema operando neste estado não pode ser considerado 100% estável, e o modo de memória síncrona máxima disponível para processadores Ryzen 5000 deve ser considerado DDR4-3800, não DDR4-4000.

Para avaliar a penalidade imposta ao desabilitar o modo de memória síncrona, testamos o desempenho do Ryzen 7 5800X com DDR4-3800 em três relógios: 1900: 1900: 1900 – quando a memória, o Infinity Fabric e as frequências do controlador de memória são as mesmas. 1900: 1900: 950 – quando a memória e o Infinity Fabric estão sincronizados, mas o controlador está configurado para a metade da frequência; 1900: 1800: 950 – quando o Infinity Fabric está operando em uma frequência assíncrona de 1800 MHz.

Além disso, ao longo do caminho, tentamos responder à questão sobre a conveniência de overclock do Infinity Fabric em sistemas onde a memória opera em uma frequência mais baixa. Os mesmos gráficos mostram os resultados obtidos ao usar DDR4-3200 no sistema em três modos: 1600: 1600: 1600 – totalmente síncrono; 1600: 1900: 1600 – assíncrono ao fazer overclock do Infinity Fabric até 1900 MHz; 1600: 1900: 800 – assíncrono, em que o Infinity Fabric tem overclock e o controlador de memória é desacelerado para metade da frequência. Todos os testes foram realizados com dois módulos de 16 GB.

 

 

A partir dos resultados dos testes sintéticos, pode-se ver que a violação da sincronia em três frequências leva não tanto a uma queda na largura de banda prática do subsistema de memória, mas a um aumento na latência. No final das contas, a latência aumenta em quase 20%, e a parte principal dessa penalidade ocorre quando o modo de meia frequência é habilitado no controlador de memória, e não quando a frequência do Infinity Fabric deixa de coincidir com a frequência da memória.

 

 

Em aplicativos, o uso de modos assíncronos não parece ser um risco de desempenho. Uma queda significativa no desempenho é perceptível apenas durante o arquivamento. No entanto, em geral, é claro que a falta de consistência entre as frequências não leva a nada de bom. Mesmo o overclock do Infinity Fabric acima da frequência da memória tem um impacto negativo no desempenho final.

 

 

Os jogos reagem de forma bastante dolorosa à assincronia. A diferença no desempenho de jogos entre um sistema com frequências iguais na rodovia processador-memória e o mesmo sistema, onde todas as três frequências (memória, Infinity Fabric, controlador) são diferentes, é em média 5%. Além disso, o impacto no FPS é causado tanto por uma diminuição na frequência do controlador de memória quanto pela falta de consistência entre a frequência da memória e o Infinity Fabric.

Como resultado, realmente não faz sentido usar a memória em modos mais rápidos do que DDR4-3800 com o Ryzen 7 5800X. Nesse caso, é imperativo garantir que a igualdade da frequência da memória, da frequência do Infinity Fabric e da frequência do controlador de memória seja observada. Você pode verificar a exatidão de seu clock com utilitários de diagnóstico, por exemplo, em HWINFO64.

Ao mesmo tempo, também vale a pena verificar a ausência de erros WHEA que aparecem em sistemas baseados no Ryzen 5000 quando o Infinity Fabric está com overclock.

⇡#Timings: são mais importantes do que a frequência ou não?

Como hoje estamos falando sobre todos os fatores que afetam o desempenho da memória e, em última análise, de todo o sistema, é simplesmente impossível ignorar os tempos. Os processadores Ryzen 5000 baseados na microarquitetura Zen 3 passaram por mudanças significativas, a mais notável delas é a combinação de oito núcleos em um complexo CCX. Isso levou a uma duplicação do tamanho do cache L3 endereçado por cada núcleo computacional, o que, por sua vez, levou a uma diminuição na latência média que ocorre quando o processador acessa os dados. Em teoria, isso poderia significar uma diminuição no impacto sobre o desempenho das temporizações da memória, o que era definitivamente perceptível nos processadores da geração anterior.

Mas um teste simples garante que o esquema de temporização com o qual um determinado conjunto de memória funciona continue a afetar o desempenho de todo o sistema. Para verificar isso, testamos um kit DDR4-3600 de 32 GB composto por dois módulos, com quatro esquemas de temporização diferentes, variando de 14-14-14-28 a 20-20-20-40. Os resultados foram bastante indicativos.

 

 

A julgar pelos números no benchmark sintético AIDA64 Cachemem, o esquema de temporização afeta principalmente a latência prática. O esquema de latência agressiva 14-14-14-28 permitirá que você supere as temporizações médias 18-18-18-36 em até 6% na latência. Na ausência de diferenças perceptíveis na largura de banda para leitura, gravação e cópia, isso parece ser bem pequeno – alterar a frequência da memória tem um efeito muito maior.

 

 

O aplicativo não se beneficia muito de temporizações mais baixas. Mesmo se compararmos os resultados obtidos com o pior e o melhor esquema de latência, verifica-se que o gap máximo de desempenho atinge apenas 5%. Além disso, essa diferença é observada apenas uma vez – ao medir a velocidade de arquivamento de dados.

 

 

Mas para jogos, os tempos ainda parecem ser uma característica bastante importante. As taxas de quadros podem variar em até 6% em termos relativos. Assim, a escolha da memória com configurações agressivas pode ser bastante justificada. No entanto, não se pode deixar de fazer uma reserva importante de que a diferença de 6% que vimos quando passamos do esquema 20-20-20-40 mais lento para o 14-14-14-28 muito vigoroso poderia ser obtida aumentando a memória frequências de 400-500 MHz. Isso dá a impressão de que a frequência da memória é uma característica mais importante do que sua latência.

⇡#Ajustando os tempos sem sofrimento e dor

A maioria dos usuários não ajusta as temporizações da memória, contando com perfis XMP. E isso é bastante natural: os perfis XMP foram colocados em uso apenas para remover a carga dos usuários sobre a seleção dos parâmetros de memória ideais que permitirão extrair o máximo possível dos módulos disponíveis. No entanto, devido ao fato de que os perfis XMP são universais e capazes de se adequar a sistemas completamente diferentes, as configurações que eles oferecem podem sempre ser melhoradas, e muitas vezes de forma bastante significativa. Isso se aplica tanto aos tempos primários, que são indicados nas especificações do módulo, quanto aos parâmetros secundários, que na realidade também podem afetar muito o desempenho – no final, após um ajuste cuidadoso, você pode contar com pelo menos 5% de aumento adicional em FPS em jogos.

É outra questão que apenas os entusiastas mais desesperados que estão dispostos a gastar não horas, mas dias e semanas no ajuste perfeito de suas configurações de montagem, podem apenas querer ajustar os numerosos parâmetros do subsistema de memória, o número dos quais ultrapassa três dezenas. Felizmente, há uma maneira bastante simples de cortar esse canto – a útil calculadora DRAM para o utilitário Ryzen, criada pelo conhecido (em círculos estreitos) desenvolvedor Yuri Bubliy (1usmus), pode ajudar.

A calculadora DRAM para Ryzen oferece perfis de configurações otimizados pré-selecionados para muitos kits de memória comuns. Basta indicar as características básicas do kit – o tipo de chips que o embasa, a versão da placa de circuito impresso DIMM, o volume dos módulos e sua classificação – e o programa oferecerá seu esquema de temporizações recomendado, que só terá devem ser transferidos para a configuração do BIOS. Naturalmente, a estabilidade não é garantida, mas na maioria dos casos a calculadora DRAM para Ryzen oferece opções sensatas que, por um lado, funcionam bem e, por outro lado, permitem que você aumente o desempenho em vários por cento graças a configurações cuidadosamente selecionadas.

Você pode descobrir as características necessárias do kit de memória instalado no sistema usando outro utilitário – Thaiphoon Burner. Isso o ajudará a identificar os componentes de hardware subjacentes dos módulos de memória que precisam ser especificados na calculadora DRAM para Ryzen.

A calculadora DRAM para Ryzen pode oferecer perfis de configuração não apenas para a frequência nominal da memória, mas também para a frequência aumentada, que pode ser aplicada ao fazer overclock dos módulos DDR4 SDRAM. É importante apenas certificar-se primeiro de que a memória disponível é capaz de funcionar nessa frequência, em princípio.

Como tudo funciona e como isso contribui para o desempenho, testamos no benchmark a seguir, no qual testamos o sistema no Ryzen 7 5800X com módulos Crucial DDR4-3600 existentes várias vezes. Ao mesmo tempo, comparamos diferentes opções para suas configurações: básico – no modo DDR4-3600 com temporizações definidas por XMP; Temporizações da calculadora DRAM para o perfil Ryzen e temporizações selecionadas manualmente. Além disso, as duas últimas opções foram usadas duas vezes: tanto no modo nominal para a memória DDR4-3600, quanto durante seu overclock para a frequência máxima sensível de DDR4-3800.

Os tempos específicos obtidos em cada um desses casos podem ser vistos usando outro utilitário útil – ZenTimings.

A redução nos valores de latência absoluta em comparação com o circuito XMP é perceptível muito bem, e isso inevitavelmente leva a melhores indicadores de desempenho.

 

 

Mesmo que você não vá além do modo DDR4-3600 nominal, ajustar as temporizações realmente permite aumentar a largura de banda prática do subsistema de memória e reduzir sua latência. Já neste estágio, podemos concluir que o perfil XMP está longe de ser uma variante ideal da configuração de memória DDR4. A possibilidade adicional de elevar a frequência da memória acima do nominal também não é supérflua – com isso, o desempenho do subsistema de memória torna-se ainda melhor.

 

 

Os resultados obtidos nas aplicações apenas confirmam que definitivamente não vale a pena negligenciar o ajuste dos parâmetros do subsistema de memória. Mesmo se você apenas mudar para o esquema de temporização da calculadora DRAM para Ryzen sem aumentar a frequência da memória, em seguida, em comparação com as temporizações do XMP, você pode obter um ganho de desempenho de até 8% (no arquivador). Ao mesmo tempo, a afinação manual enfadonha dá um desempenho ainda melhor, a diferença não é tão grande. E a propósito, se você confiar nas recomendações da calculadora DRAM para Ryzen, então em algumas situações você pode fazer sem overclock de memória em tudo. Por exemplo, em nosso caso, o perfil oferecido pelo utilitário para o modo DDR4-3800 acabou sendo menos eficaz do que para a frequência nominal da memória DDR4-3600.

 

 

Mas o mais interessante é como os jogos reagem à otimização dos tempos. Aqui, as estatísticas são as seguintes: o perfil da calculadora DRAM para Ryzen aumenta a taxa de quadros em uma média de 4% em comparação com XMP, mas se você ajustar manualmente os tempos, pode adicionar um aumento de FPS em cerca de 1% a este resultado . No mesmo caso, quando todo o arsenal de ferramentas é usado – otimização de temporizações e overclocking da memória para o estado de DDR4-3800, os resultados dos testes de jogo aumentam em alguns décimos de por cento.

Em outras palavras, os tempos que os fabricantes de memória colocam no XMP não são realmente ideais, e o uso de esquemas de ajuste otimizados é altamente recomendado. O efeito no desempenho do sistema usando atrasos selecionados corretamente é comparável, por exemplo, com memória de overclock a 400-500 MHz adicionais, e é absolutamente impossível chamá-lo de insignificante. Ao mesmo tempo, o que é importante, não é absolutamente necessário mergulhar no tedioso procedimento de otimização multicritério de um monte de atrasos inter-relacionados – você pode pegar um atalho e confiar apenas no que os programas especializados oferecem.

⇡#Achados

O principal resultado do teste em grande escala é que recebemos uma confirmação clara da importância das características de velocidade do subsistema de memória em plataformas construídas em processadores Ryzen 5000. Além disso, ele liberou o barramento Infinity Fabric de transferências de dados entre núcleos (em processadores de seis e oito núcleos), as características dos módulos de memória continuam a dar uma grande contribuição para o desempenho final. A má seleção e o ajuste descuidado dos módulos DDR4 SDRAM irão facilmente cortar uma parte significativa da velocidade do processador Ryzen e fazer com que a experiência de um computador na plataforma AMD seja pior do que poderia ser.

Pense no que dizem os números obtidos apenas em testes de jogos:

  • Optou por módulos de memória ponto a ponto, não dual – perdeu 6% na taxa de quadros;
  • Não fez overclock da memória na frequência, deixando-a no estado DDR4-3200, – perdeu mais 5% FPS;
  • Eu não estava convencido da operação síncrona do controlador de memória – recebi, adicionalmente, menos 5% no desempenho do jogo;
  • Não ajustei as temporizações, contando com o perfil XMP – faltavam outros 4% da taxa de quadros.

Mesmo qualquer um desses três pontos no total resultará em uma perda de 15% do desempenho do jogo, e este é um delta muito significativo, que não é razoável, se não criminoso, negligenciar. Portanto, recomendamos que você trate o subsistema de memória com a devida atenção, escolha os módulos DDR4 SDRAM com sabedoria e não tenha preguiça de ajustá-los posteriormente.

Levando em consideração tudo o que foi dito acima, aqueles que desejam construir um sistema baseado nos processadores Ryzen de última geração gostariam de aconselhar a escolha de módulos SDRAM DDR4 de 16 GB dual-rank baseados em chips Samsung B-die ou Micron Rev. E. Esses módulos não são apenas melhores do que muitas outras opções em termos de desempenho por si próprios, mas também permitem maior otimização na direção certa. Eles quase sempre podem ter overclock para o estado de DDR4-3600 ou DDR4-3800 e, ao mesmo tempo, ajustar os tempos para eles, incluindo não apenas os valores básicos, mas também secundários e terciários, de modo a obter um aumento adicional no desempenho . Esta é a receita para o notório “desbloquear o potencial” dos processadores Ryzen 5000 agora.

⇡#Links para utilitários

  • CPU-Z
  • HWINFO64
  • ZenTimings
  • Calculadora DRAM para Ryzen
  • Queimador Taiphoon

 

Deixe uma resposta

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *