A CD Projekt RED transformou Cyberpunk 2077 em um campo de testes para novas tecnologias. Na época do lançamento, o jogo já apresentava um modelo avançado de rastreamento de raios que cobre três aspectos principais da imagem: iluminação global (ou seja, indireta), reflexos e sombras. No entanto, como outros mecanismos híbridos, o RED Engine envolve o rastreamento de raios em operações isoladas, enquanto a maior parte da renderização ainda é feita por rasterização. O recente patch 1.62 oferece uma alternativa a essa abordagem obviamente comprometida na forma de uma simulação de iluminação totalmente rastreada.

Cyberpunk 2077 não é o primeiro projeto desse tipo. Anteriormente, o Quake II RTX e o Minecraft já demonstraram um transporte de luz unificado baseado em um algoritmo chamado Path Tracing (“rastreamento de caminho”). E embora nenhum dos dois jogos seja um fardo insuportável para as placas de vídeo modernas, eles ainda são extremamente exigentes e, afinal, as cenas do Quake II e do Minecraft, mesmo com todos os novos materiais e shaders, são muito pobres em detalhes em comparação com um título AAA moderno. O rastreamento de caminho no Cyberpunk 2077 elevou os requisitos de hardware a alturas que nem mesmo as GPUs de próxima geração mais poderosas podem fazer sem algum comprometimento.

⇡#Rastreamento de caminho em Cyberpunk 2077

Antes de passarmos para os resultados do teste, um breve histórico sobre o que é rastreamento de caminho, como ele difere do já familiar traçado de raio e por que esse algoritmo é o futuro da renderização de jogos é apropriado.

O traçado de raios começa com uma câmera virtual emitindo um raio primário para cada pixel no quadro final que sai da cena (ou seja, cor preta do pixel, cor skybox ou outro resultado padrão) ou colide com algum tipo de superfície, cujo material dita o comportamento dos raios de segunda ordem. Se o objeto não for um espelho perfeito, existem raios secundários que conectam o ponto de incidência do raio primário com todas as fontes de luz para determinar se ele recebe iluminação direta (raios de sombra). Superfícies reflexivas e transparentes também emitem raios para calcular reflexões e refrações, que por sua vez colidem com novas superfícies. Então, no caso ideal, o trabalho continua até o momento em que todos os raios secundários são conectados a uma ou outra fonte de luz.

Mas, na realidade, o número de raios aumenta ao infinito ao renderizar qualquer cena um tanto complexa, então o renderizador é sempre definido para uma determinada profundidade de recursão – este é um fator chave do qual depende a qualidade da imagem final. Outra dificuldade para o traçado de raios são as superfícies que refletem a luz de forma difusa, ou seja, em diferentes direções. Como consequência, a modelagem plausível da iluminação indireta é reduzida ao rastreamento de um grande número de raios secundários ou a alguma forma de aproximação usando algoritmos externos.

Não surpreendentemente, o efeito mais comum e computacionalmente mais barato implementado em jogos com ray tracing são as sombras, que no caso mais simples requerem apenas um salto de raio por pixel de quadro para renderizar. A renderização de superfícies especulares e iluminação global também tendem a ser reduzidas a um salto por raio para economizar recursos de GPU e são frequentemente combinadas com sondas elaboradas pelo desenvolvedor na cena que se aproximam das fontes de luz locais. É assim, por exemplo, que funciona o modelo original de traçado de raios em Cyberpunk 2077.

Apesar de todas essas limitações e “muletas”, o ray tracing continua sendo um sério desafio para as placas de vídeo do consumidor. Agora vamos falar sobre o que o path tracing muda nessa situação. O próprio processo de rastreamento de raios é completamente determinístico e, portanto, a profundidade da recursão, bem como o número de raios secundários que ocorrem em cada ponto de reflexão, determinam o quão perto uma imagem de computador é capaz de se aproximar do fotorrealismo. O Path Tracing também conta com o traçado de raios como um dos componentes do modelo, mas com a principal diferença de que em cada ponto de interseção com superfícies há apenas um reflexo do raio e em uma direção aleatória!

No entanto, embora de forma aleatória, mas não necessariamente equiprovável. Cada superfície é caracterizada por sua função de distribuição – BRDF (Função de Distribuição de Reflectância Bidirecional), cuja forma indica o quão especular, fosco ou transparente é o material. Por exemplo, uma superfície perfeitamente fosca tem a mesma probabilidade de refletir um feixe em qualquer ângulo. Um espelho ideal em 100% dos casos reflete o feixe em um ângulo igual ao ângulo de incidência. Mas é provável que a maioria dos materiais de cena do jogo tenham qualidades intermediárias, o que significa que sua função BRDF inerente fornece uma alta probabilidade de reflexão do feixe em um determinado ângulo e uma probabilidade relativamente baixa em outros ângulos (aos quais, a propósito, podemos adicionar a probabilidade de um feixe passar com refração).

Como resultado, o rastreamento de caminho é construído desde o início para simular reflexões diretas e difusas de luz de maneira fisicamente precisa. O algoritmo não busca encontrar a única solução correta para esse problema, mas gradualmente se aproxima dele, liberando muitos (muitos) raios primários. Alguns deles, dentro do limite de reflexos definido pelo desenvolvedor, chegarão a uma ou outra fonte de luz e, assim, contribuirão para a cor final do pixel. A precisão do resultado depende do número de raios primários, que podem ser ajustados suavemente às especificidades da tarefa e do recurso de computação, e a aparência granulada da imagem com um pequeno número de raios pode ser facilmente corrigida com uma redução de ruído filtro.

Obviamente, o rastreamento de caminho tem suas limitações. Por exemplo, ele precisa de sobreamostragem para evitar ruído ao calcular cáusticas ópticas (um caso especial é o jogo de luz em um meio líquido). E o mais importante, é certamente um método de renderização muito mais exigente do que um híbrido de rasterização com ray tracing dosado. A recursão no Cyberpunk 2077 foi limitada a apenas dois reflexos, no entanto, o crescimento explosivo no número de raios (mais de 600 por pixel!) Coloca enormes demandas não apenas na eficiência das unidades GPU RT modernas, mas também na velocidade de seu sombreador variedade.

Não surpreendentemente, a CD Projekt RED focou principalmente na última geração de aceleradores da NVIDIA, que têm ambos em abundância. No entanto, até os chips Ada tiveram que ajudar um pouco. Primeiro, o Cyberpunk 2077 agora usa o recurso SER (Shader Execution Reordering), que permite que a GPU reagrupe os threads de computação para melhorar a uniformidade das solicitações de memória de vídeo, e atualmente está disponível apenas por meio de uma extensão da interface proprietária NVAPI. Em segundo lugar, antes mesmo do rastreamento de caminho, um pacote de tecnologias DLSS 3.0 foi introduzido no jogo, que permite não apenas dimensionar quadros, mas também gerar quadros adicionais usando a própria rede neural – novamente, apenas nos aceleradores da série GeForce RTX 40, que receberam lógica aprimorada para cálculos de fluxo óptico.

Quanto aos produtos AMD, apesar do grande progresso da arquitetura RDNA, no campo de rastreamento de raios ainda está uma geração atrás das conquistas da NVIDIA, e mesmo assim ao usar renderização híbrida, e a tecnologia de upscaling FSR ainda não usa computação matricial lógica de qualquer forma , apresentada nos aceleradores Radeon RX 7000. Nada a dizer sobre placas gráficas Intel discretas, porque essas são soluções intermediárias e o rastreamento de caminho no Cyberpunk 2077 precisa de hardware de primeira linha. Felizmente, o Path Tracing não é um substituto absoluto para a renderização híbrida e só pode ser ativado no modo de câmera.

As capturas de tela abaixo mostram como a imagem muda dependendo do modo de renderização: sem ray tracing, ray tracing isolado e full path tracing. Desnecessário dizer que o Path Tracing muda completamente alguns quadros. Transferência de várias cores de uma superfície para outra e uma distribuição mais realista da luz solar – tudo isso é impressionante. No entanto, o CD Projekt RED ainda precisa trabalhar nas propriedades reflexivas de certos materiais, e alguns lugares da cidade parecem ter sido projetados sem o modelo de iluminação correto e, como resultado, não parecem nada como antes – este é um problema típico de jogos que mudaram para rastreamento de caminho já após o lançamento.

RT desligado

RT: psicopata

Rastreamento de caminho

RT desligado

RT: psicopata

Rastreamento de caminho

RT desligado

RT: psicopata

Rastreamento de caminho

RT desligado

RT: psicopata

Rastreamento de caminho

RT desligado

RT: psicopata

Rastreamento de caminho

RT desligado

RT: psicopata

Rastreamento de caminho

RT desligado

RT: psicopata

Rastreamento de caminho

⇡#Bancada de teste, metodologia de teste

Teste de desempenho realizado usando o benchmark integrado do Cyberpunk 2077. As taxas de quadros média e mínima são derivadas de uma matriz de tempos de renderização de quadros individuais que o jogo grava no arquivo de resultados.

A taxa média de quadros nos gráficos é o recíproco do tempo médio de renderização do quadro. Para estimar a taxa mínima de quadros, é calculado o número de quadros gerados em cada segundo do teste. Dessa matriz de números, é retirado o valor correspondente ao 1º percentil da distribuição.

Tomamos a predefinição Ultra como base para as configurações gráficas, o que leva aos valores máximos​​​de todos os parâmetros individuais, exceto a qualidade dos reflexos no espaço da tela: a última opção causa uma queda extremamente grande na taxa de quadros durante renderização rasterizada, mas não importa em condições de ray tracing parcial ou total.

⇡#Participantes do teste

  • AMD Radeon RX 7900 XTX (1720/2499 MHz, 20 Gb/s, 24 GB);
  • AMD Radeon RX 7900 XT (1387/2394 MHz, 20 Gb/s, 20 GB);
  • AMD Radeon RX 6900 XT (1825/2250 MHz, 16 Gb/s, 16 GB);
  • AMD Radeon RX 6800 XT (1825/2250 MHz, 16 Gb/s, 16 GB);
  • AMD Radeon RX 6800 (1700/2105 MHz, 16 Gb/s, 16 GB);
  • AMD Radeon RX 6700 XT (2321/2581 MHz, 16 Gb/s, 12 GB);
  • AMD Radeon RX 6600 XT (2064/2607 MHz, 16 Gb/s, 8 GB);
  • AMD Radeon RX 6600 (1626/2491 MHz, 14 Gb/s, 8 GB);
  • NVIDIA GeForce RTX 4090 (2235/2535 MHz, 21 Gb/s, 24 GB);
  • NVIDIA GeForce RTX 4080 (2205/2505 MHz, 22,4 Gb/s, 16 GB);
  • NVIDIA GeForce RTX 4070 Ti (2310/2610 MHz, 21 Gb/s, 12 GB);
  • NVIDIA GeForce RTX 4070 (1920/2550 MHz, 21 Gb/s, 12 GB);
  • NVIDIA GeForce RTX 3090 (1395/1695 MHz, 19,5 Gb/s, 24 GB);
  • NVIDIA GeForce RTX 3080 Ti (1365/1665MHz, 19Gb/s, 12GB);
  • NVIDIA GeForce RTX 3080 (1440/1710 MHz, 19 Gb/s, 10 GB);
  • NVIDIA GeForce RTX 3070 Ti (1575/1770 MHz, 19 Gb/s, 8 GB);
  • NVIDIA GeForce RTX 3070 (1500/1730 MHz, 14 Gb/s, 8 GB);
  • NVIDIA GeForce RTX 3060 Ti (1410/1665MHz, 14Gb/s, 8GB);
  • NVIDIA GeForce RTX 3060 (1320/1837 MHz, 15 Gb/s, 12 GB);
  • NVIDIA GeForce RTX 3050 (1550/1780 MHz, 14 Gb/s, 8 GB);
  • NVIDIA GeForce RTX 2080 Ti Founders Edition (1350/1635MHz, 14Gb/s, 11GB);
  • NVIDIA GeForce RTX 2080 SUPER (1650/1815 MHz, 15,5 Gbps, 8 GB);
  • NVIDIA GeForce RTX 2080 Founders Edition (1515/1800 MHz, 14 Gb/s, 8 GB);
  • NVIDIA GeForce RTX 2070 SUPER (1605/1770 MHz, 14 Gb/s, 8 GB);
  • NVIDIA GeForce RTX 2070 Founders Edition (1410/1710 MHz, 14 Gb/s, 8 GB);
  • NVIDIA GeForce RTX 2060 SUPER (1470/1650 MHz, 14 Gb/s, 8 GB);
  • NVIDIA GeForce RTX 2060 (1365/1680MHz, 14Gb/s, 6GB);
  • Intel Arc A770 (2100/2400 MHz, 17,5 Gb/s, 16 GB);
  • Intel Arc A750 (2050/2400 MHz, 16 Gb/s, 8 GB).

Observação. Entre colchetes após os nomes das placas de vídeo, estão indicadas as frequências base e boost de acordo com as especificações de cada aparelho. As placas de vídeo com overclock de fábrica são alinhadas com os parâmetros de referência (ou próximos a eles), desde que isso possa ser feito sem ajustar manualmente a curva de frequência do clock. Caso contrário, as configurações do fabricante são usadas.

Resultado dos testes. Testes de grupo em outros jogos

⇡#1920 × 1080

Os primeiros testes – em 1080p, que agora é considerado baixo – mostraram quão grandes são as demandas de renderização totalmente rastreada nas capacidades da GPU. Esqueça as implementações anteriores de rastreamento de caminho em jogos como Minecraft e Quake II RTX. Cyberpunk 2077 é a referência definitiva para placas gráficas de última geração. O único aparelho que conseguiu superar a fronteira de 60 FPS, e com margem de 11 FPS, acabou sendo a GeForce RTX 4090. De todos os outros participantes do teste, mesmo a GeForce RTX 4080 não atingiu a cobiçada marca, parando em 49. Por sua vez, o resultado do modelo pré-top é a série 30, GeForce RTX 3090, é 36 FPS – menos que o RTX 4070 Ti.

As placas gráficas baseadas em Navi de terceira geração da AMD têm um bom desempenho na renderização híbrida, mas foram adiadas sob a carga de rastreamento de caminho. A Radeon RX 7900 XTX está modestamente abaixo da GeForce RTX 3060 Ti, enquanto a Radeon RX 7900 XT é comparável em desempenho ao carro-chefe da série GeForce 20, a RTX 2080 Ti.

A Radeon RX 6900 XT só pode competir com a GeForce RTX 3050, GeForce RTX 2060 SUPER e RTX 2070: os resultados desses dispositivos estão na faixa de 9 a 10 FPS. A Radeon RX 6800 ganha seu lugar no gráfico com uma taxa de quadros de 7 FPS – como a GeForce RTX 2060, o acelerador de menor potência da marca RTX.

Por fim, os produtos da Intel – Arc A750 e Arc A770 – fecham a lista de aparelhos concorrentes com resultados de 4 e 6 FPS, respectivamente.

Obviamente, no Cyberpunk 2077 com rastreamento de caminho, alguma forma de upscaling é necessária para quase todas as placas de vídeo modernas. Felizmente, este jogo pode oferecer o método de dimensionamento de quadro mais adequado para qualquer uma das GPUs modernas: DLSS 3.0 para dispositivos NVIDIA, FSR 2.1 para AMD e XeSS para aceleradores Intel. Os participantes da comparação foram testados novamente – cada um usando tecnologia nativa – com a configuração de upscaling balanceada, que fornece uma proporção de cerca de 1,7 em cada lado entre o tamanho dos quadros original e final.

Graças ao DLSS, a taxa de quadros de 60 FPS foi conquistada por placas de vídeo como GeForce RTX 4070 e GeForce RTX 3080. Mas os aceleradores “vermelhos” precisam urgentemente de configurações FSR mais agressivas, que, infelizmente, estão associadas a significativos perdas na qualidade da imagem, especialmente na resolução de 1080p. Assim, a Radeon RX 7900 XTX conseguiu aumentar a taxa de quadros apenas até 41 FPS, e a Radeon RX 6900 XT – até 26.

A tecnologia XeSS da Intel é extremamente eficiente no Cyberpunk 2077, aumentando o Arc A770 de 6 para 15 fps e o Arc A750 de 4 para 9 fps. É uma pena que isso ainda seja totalmente insuficiente para um jogo confortável. Entre as placas de vídeo “vermelhas”, a posição inferior do gráfico pertence à Radeon RX 6600 (11 FPS), e entre as “verdes”, a GeForce RTX 2060 (16 FPS). Do Radeon RX 6500 XT, bem como do Intel Arc A380 – os dispositivos de menor consumo de energia com rastreamento de raio de hardware – não conseguimos espremer nem 4 quadros por segundo.

⇡#2560 × 1440

Em 1440p, mesmo os proprietários da GeForce RTX 4090 terão que se contentar com uma taxa de quadros de compromisso de 45 FPS, enquanto a RTX 3090 para em 21. ainda um lugar modesto em 10 FPS entre a GeForce RTX 2080 Ti na parte inferior e a RTX 3070 no topo da escala de desempenho.

A lista de dispositivos que atingiram uma taxa de quadros de pelo menos 4 FPS, que tomamos como ponto de partida para não prolongar o processo geral de teste, foi significativamente reduzida sob a pressão do aumento da carga de computação. O menor resultado entre as placas de vídeo “verdes” que mantiveram seu lugar no gráfico agora pertence à GeForce RTX 2060 SUPER (4 FPS), e entre as “vermelhas”, a Radeon RX 6800 XT (5 FPS). As GPUs discretas da Intel foram longe ao renderizar em resolução nativa.

Ao usar o upscaling, a GeForce RTX 4080 atingiu taxas de quadros acima de 60 FPS, o que não pode ser dito sobre a GeForce RTX 4070, RTX 4070 Ti e todos os representantes da 30ª família. Até a GeForce RTX 3090 atinge uma taxa de quadros de compromisso de 52 FPS. Por sua vez, a GeForce RTX 2080 Ti aumentou o desempenho para 22 FPS – um pouco menos que a Radeon RX 7900 XTX.

As últimas colocações no gráfico foram ocupadas pela GeForce RTX 2060 e Radeon RX 6700 XT com resultados de 7-8 FPS. Os produtos da Intel se enquadram na mesma categoria de desempenho: 5 FPS para o Arc A750 e 9 FPS para o Arc A770.

⇡#3840 × 2160

Como você pode esperar, apenas um punhado das GPUs de maior desempenho conseguiu completar o benchmark em resolução 4K em um período de tempo razoável, muito menos ser capaz de jogar normalmente. A GeForce RTX 4090 parou em 21 FPS e a GeForce RTX 3090 – 10. De todos os modelos “vermelhos”, um entrou no gráfico – a Radeon RX 7900 XTX com resultado de 4 FPS, e a GeForce RTX 3080 foi apenas 1 FPS mais rápido.

O aumento de escala por um fator de 1,7 não é mais suficiente em 4K para superar a falta de poder de processamento bruto da GPU. Mesmo a GeForce RTX 4090 no modo DLSS Balanced, a taxa de quadros é um pouco acima de 50 FPS. O que podemos dizer sobre a Radeon RX 7900 XTX com seu resultado de 12 FPS ou a Radeon RX 6900 XTX (7 FPS).

Seja como for, para placas gráficas fracas, o dimensionamento dá o aumento mais significativo na taxa de quadros, graças ao qual dispositivos como GeForce RTX 2060 SUPER, Radeon RX 6800 e Intel Arc A750 permaneceram no gráfico.

⇡#Conclusões

Há muito tempo não encontramos um jogo em que algum hardware atual, exceto uma, a placa de vídeo mais cara e de alto desempenho, não desenvolvesse uma taxa de quadros acima de 60 FPS, mesmo com uma resolução de tela baixa para os atuais padrões. Não é à toa que o ray tracing completo em Cyberpunk 2077 foi apresentado apenas como uma demonstração de uma nova tecnologia.

No entanto, apesar de futuras otimizações do próprio mecanismo do Cyberpunk 2077 e dos drivers da GPU, o rastreamento de caminho em um ambiente tão complexo sempre será um método de renderização extremamente exigente. É improvável que mesmo os proprietários da GeForce RTX 4090 comprem essa placa de vídeo para ficarem satisfeitos com o jogo com resolução de 1080p e taxas de quadros na faixa de 60 FPS. O upscaling do DLSS com pelo menos um fator de escala Balanced é exigido por todos os aceleradores verdes. É aqui que o recurso de interpolação oferecido pela terceira versão do DLSS é útil – infelizmente, apenas nas placas de vídeo da série 40.

No que diz respeito aos produtos AMD, eles não estão mais tão atrás de seus concorrentes “verdes” em ray tracing, mas o full path tracing não é o mesmo que a renderização híbrida familiar de muitos outros jogos. Como resultado, até mesmo a principal Radeon RX 7900 XTX caiu para o nível da GeForce RTX 2080 Ti, duas gerações de placas de vídeo NVIDIA mais antigas. E a AMD ainda não possui um método de upscaling de alta qualidade como o DLSS para fornecer um aumento na taxa de quadros devido a grandes fatores de dimensionamento sem danos tangíveis à qualidade da imagem.

Por fim, os aceleradores Intel Arc discretos receberam nada mais do que uma nota de rodapé nas margens desta análise. Embora os chips Intel tenham uma lógica de rastreamento de raio mais poderosa do que o silício da série Radeon 6000 (e isso aparece nos resultados), e a escala XeSS – outra adição ao Cyberpunk 2077 – é bastante eficaz, eles simplesmente não têm desempenho bruto suficiente para um jogo normal.

⇡#Testes em grupo de placas de vídeo em outros jogos

A 3DNews realiza regularmente testes em massa de placas gráficas em jogos populares. Se você quiser saber como modelos e dispositivos modernos de gerações passadas funcionam em outros projetos, o arquivo de benchmark está à sua disposição:

  • Testes em grupo de 54 placas de vídeo no Atomic Heart;
  • Testes em grupo de 49 placas gráficas em No Man’s Sky;
  • Teste em grupo de 45 placas de vídeo em God of War;
  • 44 placas gráficas no Halo Infinite: quem aguenta o novo Halo?
  • Testes em grupo de 46 placas gráficas no Battlefield 2042;
  • Teste em grupo de 46 placas de vídeo em Far Cry 6;
  • Escolhendo uma placa de vídeo para o New World. Testes em grupo de 46 modelos;
  • DOOM Eternal com ray tracing e DLSS: teste em grupo de 19 placas gráficas;
  • Testes em grupo de 45 placas de vídeo em Mass Effect Legendary Edition;
  • Teste em grupo de 42 placas de vídeo em Cyberpunk 2077 – com vigor renovado!
  • Teste em grupo de 42 placas de vídeo no HITMAN III;
  • Teste em grupo de 40 placas de vídeo em Cyberpunk 2077;
  • Teste em grupo de 44 placas de vídeo no Microsoft Flight Simulator 2020;
  • Teste em grupo de 43 placas de vídeo em Horizon Zero Dawn;
  • Teste em grupo de 48 placas de vídeo em Death Stranding;
  • Teste em grupo de 20 placas de vídeo no Half-Life: Alyx;
  • Teste em grupo de placas de vídeo no Minecraft RTX: cubos pesados;
  • Teste de aniversário de 49 placas de vídeo em GTA V: cinco anos depois;
  • Teste em grupo de 49 placas gráficas em DOOM Eternal: tiroteio em massa;
  • MechWarrior 5: Mercenários. Teste em grupo de 44 placas de vídeo: em suspense;
  • Testes em grupo de 46 placas de vídeo em Star Wars Jedi: Fallen Order;
  • Doomsday para placas gráficas de jogos: testando 42 modelos em Red Dead Redemption 2;
  • Testes em grupo de 44 placas gráficas em Call of Duty: Modern Warfare;
  • Testes em grupo de 43 placas gráficas em Borderlands 3;
  • Testes em grupo de 34 placas gráficas no Control;
  • Teste em grupo de placas de vídeo no Quake II RTX: Quake desacelera novamente.

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *