24 de setembro de 2020

Avalanche Notícias

Você conectado com o mundo

Click to Shot – Teste de atraso de hardware em jogos

15 min read

Desde tempos imemoriais, os recursos de jogos de computadores e componentes individuais do sistema são medidos em quadros por segundo, e o padrão ouro dos testes são os benchmarks de longo prazo, que permitem comparar vários dispositivos em termos de desempenho sustentável. No entanto, nos últimos anos, o desempenho da GPU tem sido visto de um ângulo diferente. Nas análises das placas de vídeo, gráficos da duração da renderização de quadros individuais apareceram, a questão da estabilidade do FPS surgiu em sua altura máxima e as taxas de quadros médias agora são boas para acompanhar com os valores mínimos filtrados pela borda do 99º percentil do tempo de quadro. As melhorias nos métodos de teste são destinadas a encontrar atrasos que se dissolvem na taxa de quadros média, mas às vezes bastante perceptíveis a olho nu do usuário.

No entanto, qualquer ferramenta de medição de software operando dentro do sistema de teste dá apenas uma estimativa indireta da variável oculta, que é de importância decisiva para um jogo confortável – o intervalo de tempo entre pressionar um botão no teclado ou mouse até que a imagem no monitor mude. Temos que ser guiados por uma regra simples, que diz que quanto maior o FPS no jogo e quanto mais estável ele for, menor será o tempo de resposta à entrada. Além disso, parte do problema já foi resolvido por monitores rápidos com taxa de atualização de 120, 144 ou 240 Hz, sem falar nas futuras telas de 360 ​​Hz.

No entanto, os jogadores, especialmente jogadores em jogos multijogador competitivos, que procuram a menor vantagem sobre seus rivais no hardware e estão prontos para montar computadores com overclock para solicitar dezenas de FPS extras em CS: GO, ainda não tiveram a oportunidade de estimar diretamente o atraso de entrada. Afinal, técnicas tão precisas e laboriosas quanto capturar a tela com uma câmera de alta velocidade estão disponíveis apenas em um ambiente de laboratório.

Mas agora isso está prestes a mudar – conheça o LDAT (Latency Display Analysis Tool), uma ferramenta de hardware versátil para medir a latência de jogos. Os leitores familiarizados com acrônimos como FCAT podem adivinhar que se trata de um produto NVIDIA. Na verdade, a empresa ofereceu o dispositivo para selecionar publicações de TI, incluindo 3DNews. Vamos ver se uma nova técnica de medição pode lançar luz sobre o misterioso fenômeno do input lag e ajudar os jogadores na escolha de componentes para competições de e-sports.

⇡#LDAT – como funciona

O funcionamento do LDAT é muito simples. O núcleo do sistema é um sensor de luz de alta velocidade com um microcontrolador, que é montado no ponto desejado da tela. Um mouse modificado é conectado a ele, e o software de controle via interface USB registra o tempo que separa o pressionamento da tecla e o salto local no brilho da imagem. Assim, se colocarmos o sensor sobre o cano de uma arma em um atirador, obteremos o valor exato da latência que o monitor, o computador e toda a pilha de software (incluindo drivers de dispositivo, jogo e sistema operacional) precisam para reagir às ações do usuário.

A beleza dessa abordagem é que o LDAT não depende de nenhum hardware e programas instalados no computador. O fato de a NVIDIA ter se encarregado da produção de outro instrumento de medição, que, aliás, está disponível apenas para um círculo limitado de jornalistas de TI, sugere que a empresa busca destacar as vantagens de seus próprios produtos em comparação com os concorrentes (isso já acontecia com o FCAT há vários anos ) Na verdade, os monitores G-SYNC 360Hz estão prestes a chegar ao mercado e os desenvolvedores de jogos começarão a usar as bibliotecas NVIDIA Reflex para reduzir a latência em jogos Direct3D 12. No entanto, temos certeza de que o LDAT em si não fornece concede às placas de vídeo “verdes” e não distorce os resultados das “vermelhas”, pois o aparelho não tem acesso à configuração do hardware experimental.

Desnecessário dizer que o LDAT abre enormes perspectivas em seu campo de aplicação. Compare monitores de jogos (e até TVs) com uma ou outra taxa de atualização e diferentes tipos de matrizes, verifique como a latência é afetada pelas tecnologias de sincronização adaptativa G-SYNC e FreeSync, dimensionamento de quadros usando uma placa de vídeo ou monitor – tudo isso se tornou possível. Mas primeiro, decidimos focar em uma tarefa mais restrita e verificar como vários jogos competitivos, aprimorados para FPS altos e tempos de reação baixos, funcionam em placas de vídeo de várias categorias de preços. Mais precisamente, estamos interessados ​​em duas questões principais: é um excesso de frame rate uma garantia de baixa latência e em que condições não faz sentido aumentá-lo (e portanto comprar uma placa de vídeo mais potente). Em particular, é útil exceder a taxa de quadros correspondente à taxa de atualização da tela se você tiver a sorte de possuir um monitor de 240 Hz de alta velocidade.

Para o teste, selecionamos quatro projetos multiplayer populares – CS: GO, DOTA 2, Overwatch e Valorant – que são pouco exigentes para que as GPUs modernas, incluindo modelos de orçamento, possam desenvolver desempenho ao nível de centenas de FPS. Ao mesmo tempo, os jogos listados permitem que você organize facilmente um ambiente para medição confiável do tempo de reação, quando as condições constantes são mais importantes: a mesma posição do personagem, uma arma em cada teste, etc. Por esta razão, tivemos que adiar os benchmarks por enquanto em jogos como PlayerUnknown’s Battlegrounds e Fortnite. No PUBG, simplesmente não há maneira de isolar de outros jogadores, mesmo no intervalo de teste, e Fortnite no Battle Lab para um jogador ainda não está protegido contra saques aleatórios e, portanto, torna impossível testar várias placas de vídeo com a mesma arma em um período de tempo razoável.

Além disso, a vantagem dos jogos selecionados é que eles funcionam sob a API Direct3D 11, que, ao contrário do Direct3D 12, permite que o driver da placa de vídeo defina limites na fila de renderização de quadros que o processador central pode preparar para renderizar para a GPU no pipeline de gráficos do software.

Sob condições padrão, especialmente quando o gargalo do sistema são os recursos de computação da placa de vídeo, a fila de quadros aumenta para três por padrão, ou até mais se o aplicativo exigir. Dessa forma, o Direct3D fornece utilização contínua da GPU e uma taxa de renderização constante. Mas isso tem um efeito colateral na forma de um atraso na resposta à entrada, porque a API não permite que quadros pré-programados sejam eliminados da fila. As configurações correspondentes nos drivers da placa de vídeo, que a AMD popularizou sob a marca Radeon Anti-Lag, tinham como objetivo combater o lag, e então a NVIDIA tinha uma opção de modo de baixa latência semelhante.

No entanto, tais medidas não são um remédio universal para a latência: por exemplo, se o desempenho de um jogo é restringido pelos recursos do processador central, não da GPU, uma fila de quadros curta (ou sua ausência completa) apenas torna o gargalo da CPU mais estreito. Além do resto do programa de teste, pretendemos descobrir se há algum benefício tangível das “tecnologias” do Radeon Anti-Lag e Modo de Baixa Latência, em quais jogos e em qual hardware.

⇡#Suporte de teste, metodologia de teste

As medições de taxa de quadros e tempo de reação em todos os jogos foram realizadas no máximo ou perto das configurações de qualidade gráfica máxima para a) acentuar as diferenças entre os dispositivos comparados, b) obter resultados tanto em altas taxas de quadros que excedem a taxa de atualização da tela e vice-versa … Especificamente para este artigo, pegamos emprestado um monitor Samsung Odyssey 9 (C32G75TQSI) rápido com resolução WQHD e taxa de atualização de 240 Hz – o máximo para monitores modernos antes que as telas de 360 ​​Hz estejam à venda. As tecnologias de taxa de atualização adaptável (G-SYNC e FreeSync) foram desativadas.

⇡#Participantes do teste

  • AMD Radeon RX 5700 XT (1605/1905 MHz, 14000 Mb / s, 8 GB);
  • AMD Radeon RX 5500 XT (1607/1845 MHz, 14000 Mbps, 8 GB);
  • AMD Radeon RX 590 (1469/1545 MHz, 8000 Mb / s, 8 GB);
  • NVIDIA GeForce RTX 2080 Ti Founders Edition (1350/1635 MHz, 14000 Mb / s, 11 GB);
  • NVIDIA GeForce RTX 2070 SUPER (1605/1770 MHz, 14000 Mb / s, 8 GB);
  • NVIDIA GeForce RTX 2060 SUPER (1470/1650 MHz, 14000 Mbit / s, 8 GB);
  • NVIDIA GeForce GTX 1650 SUPER (1530/1770 MHz, 8000 Mbps, 4 GB);
  • NVIDIA GeForce GTX 1650 (1485/1725 MHz, 8000 Mbps, 4 GB);

Nota Entre parênteses após os nomes das placas de vídeo, as frequências base e de reforço são indicadas de acordo com as especificações de cada dispositivo. As placas de vídeo com um design não de referência são trazidas de acordo com os parâmetros de referência (ou próximos a estes), desde que isso possa ser feito sem editar manualmente a curva do relógio. Caso contrário (os aceleradores da série GeForce 16, bem como a GeForce RTX Founders Edition), são usadas as configurações do fabricante.

⇡#Counter-Strike: Global Offensive

Os resultados do teste no primeiro jogo, CS: GO, deram muito alimento para a mente. Este é o projeto mais leve em todo o programa de teste, onde placas gráficas como a GeForce RTX 2080 Ti atingem taxas de quadros acima de 600 FPS, e até mesmo o mais fraco dos oito participantes do teste (GeForce GTX 1650 SUPER e Radeon RX 590) se mantém bem acima da frequência atualização do monitor a 240 Hz. No entanto, CS: GO ilustrou perfeitamente a tese de que aumentar o FPS além da frequência do monitor não é de todo inútil para reduzir a latência. Se compararmos as placas de vídeo do grupo superior (GeForce RTX 2070 SUPER e superior, bem como a Radeon RX 5700 XT) com os modelos mais jovens (GeForce GTX 1650 SUPER, GeForce GTX 1060, Radeon RX 5500 XT e Radeon RX 590), estamos falando de uma diferença de uma vez e meia no total tempo decorrido desde o pressionamento do botão do mouse até o aparecimento do flash na tela. Em termos absolutos, o ganho chega a 9,2 ms – à primeira vista, não muito, mas, por exemplo, mudar a taxa de atualização da tela de 60 para 144 Hz (9,7 ms) dá quase o mesmo!

Quanto à forma como se relaciona o tempo de latência de placas de vídeo pertencentes à mesma ampla categoria de preços, mas baseadas em chips de diferentes fabricantes, não encontramos diferenças significativas em cada grupo. O mesmo se aplica às opções nos drivers do acelerador, projetados para reduzir o atraso, reduzindo a fila de quadros no Direct3D 11. No CS: GO (pelo menos sob essas condições de teste), eles geralmente não têm nenhum efeito útil. No grupo de placas de vídeo fracas há uma ligeira mudança no tempo de reação, mas apenas na GeForce GTX 1650 SUPER atingiu significância estatística nos resultados.

Aproximadamente. Ícones de cores saturadas indicam resultados com configurações de driver padrão. Ícones esmaecidos – com a opção Modo de baixa latência habilitada (Ultra) ou Radeon Anti-Lag. Preste atenção à escala vertical – começa acima de zero.

Aproximadamente. As diferenças estatisticamente significativas no tempo médio de reação (pelo teste t de Student) são destacadas em vermelho.

⇡#DOTA 2

Embora DOTA 2 também seja considerado um jogo pouco exigente pelos padrões atuais, é mais difícil para as placas de vídeo modernas atingir várias centenas de FPS nele. Assim, todas as soluções de orçamento participantes da comparação caíram abaixo da taxa de quadros de 240 quadros por segundo, que corresponde à taxa de atualização da tela. Aceleradores poderosos, começando com a Radeon RX 5700 XT e GeForce RTX 2060 SUPER, produzem mais de 360 ​​FPS aqui, mas, ao contrário do CS: GO, DOTA 2 direciona mais eficazmente o excesso de velocidade da GPU para combater o lag. No jogo anterior, uma placa de vídeo do nível do Radeon RX 5700 XT era o suficiente, de forma que não havia sentido em aumentar ainda mais o desempenho por uma questão de tempo de reação. Aqui, a latência continua diminuindo em placas de vídeo mais potentes até a GeForce RTX 2080 Ti.

Deve-se destacar que surgem dúvidas sobre os resultados da Radeon RX 5700 XT neste jogo. O carro-chefe da AMD atual supera de longe até a GeForce RTX 2060 em latência e não teve um desempenho melhor do que os modelos mais jovens, apesar da taxa de quadros mais alta. Mas encurtar a fila de renderização de quadros no DOTA 2 é realmente útil. O efeito não é tão grande que até mesmo ciberatletas experientes notassem, mas é estatisticamente significativo para quatro placas de vídeo em oito

Aproximadamente. Ícones de cores saturadas indicam resultados com configurações de driver padrão. Ícones claros – com a opção Modo de baixa latência habilitada (valor Ultra) ou Radeon Anti-Lag. Preste atenção à escala vertical – começa acima de zero.

Aproximadamente. As diferenças estatisticamente significativas no tempo médio de reação (pelo teste t de Student) são destacadas em vermelho.

⇡#Overwatch

Overwatch é o mais pesado dos quatro jogos de teste com qualidade gráfica máxima com anti-aliasing de tela cheia habilitado. Sem surpresa, cada gigaflop de desempenho de GPU beneficia o tempo de resposta aqui. A faixa de valores de atraso no Overwatch entre placas de vídeo como a GeForce RTX 2080 Ti e a Radeon RX 5500 XT é dupla. Os números também indicam que placas de vídeo mais potentes do que a GeForce RTX 2070 SUPER aumentam apenas o FPS, mas não podem mais acelerar a reação, mesmo nominalmente. Mas substituir a Radeon RX 5700 XT ou GeForce RTX 2060 SUPER pela notória RTX 2070 SUPER, em teoria, faz sentido para minimizar o lag enquanto mantém a alta qualidade gráfica. Além disso, em Overwatch, um dos aceleradores nas fichas “vermelhas” mostrou-se novamente do lado ruim. Desta vez, a Radeon RX 5500 XT, que supera significativamente todas as outras soluções de orçamento em tempo médio de resposta.

O Overwatch mais uma vez ajudou a provar que a) o desempenho de uma placa de vídeo, mesmo em altas taxas de quadros, ainda afeta o valor de atraso, b) uma GPU formalmente mais eficiente não garante atrasos de resposta de entrada menores. Além de tudo isso, o jogo demonstrou o trabalho de referência das configurações anti-lag do driver gráfico. Ao jogar em placas de vídeo relativamente fracas (GeForce GTX 1650 SUPER, GeForce GTX 1060, Radeon RX 5500 XT e Radeon 590), uma fila de quadros mais curta pode reduzir o lag em 9% a 17%. Bem, para hardware poderoso, ainda é completamente inútil.

Aproximadamente. Ícones de cores saturadas indicam resultados com configurações de driver padrão. Ícones claros – com a opção Modo de baixa latência habilitada (valor Ultra) ou Radeon Anti-Lag. Preste atenção à escala vertical – começa acima de zero.

Aproximadamente. As diferenças estatisticamente significativas no tempo médio de reação (pelo teste t de Student) são destacadas em vermelho.

⇡#Valorizando

Valorant se destacou entre os jogos de teste com excelente – ou medíocre – otimização gráfica. O fato é que apesar da enorme diferença no desempenho potencial dos GPUs de teste, de acordo com estimativas da taxa de quadros, todos eles se concentraram na faixa de 231 a 309 FPS. E isso apesar do fato de que escolhemos deliberadamente a cena que usa mais recursos para medições de latência, a fim de ampliar as diferenças esperadas. No entanto, a distribuição de lag do Valorant é algo semelhante ao CS: GO. Neste jogo, os proprietários de uma GeForce RTX 2060 SUPER ou Radeon RX 5700 XT estão em pé de igualdade com os usuários de aceleradores mais caros e poderosos. Mesmo as placas de vídeo de baixo custo da classe GeForce GTX 1650 SUPER e Radeon RX 5500 XT não estão muito atrás das antigas. Com tal entrada, não é surpreendente que limitar a fila de quadros do Direct3D no Valorant seja inútil: as configurações correspondentes têm um efeito estatisticamente significativo para as placas de vídeo selecionadas, mas seu valor é absolutamente escasso.

Aproximadamente. Ícones de cores saturadas indicam resultados com configurações de driver padrão. Ícones claros – com a opção Modo de baixa latência habilitada (valor Ultra) ou Radeon Anti-Lag. Preste atenção à escala vertical – começa acima de zero.

Aproximadamente. As diferenças estatisticamente significativas no tempo médio de reação (pelo teste t de Student) são destacadas em vermelho.

⇡#Achados

A medição de latência de reação em jogos por hardware produziu resultados ricos, o que, francamente, questiona os métodos usados ​​na indústria para avaliar a velocidade de placas de vídeo, quando a taxa de quadros foi o único parâmetro medido por várias décadas. Claro, FPS e lag estão intimamente correlacionados um com o outro, mas, pelo menos em jogos de esportes, quando há uma luta para cada milissegundo de latência, a taxa de quadros não permite mais uma descrição exaustiva do desempenho.

Em um breve estudo de projetos multiplayer populares, descobrimos vários fenômenos interessantes. Primeiro, nossos dados refutam a crença popular de que não faz sentido aumentar o FPS além dos valores correspondentes à taxa de atualização da tela. Mesmo em um monitor de 240 Hz muito rápido, jogos como Counter-Strike: Global Offensive podem reduzir o lag pela metade, substituindo uma placa de vídeo de baixo custo por um modelo top. Estamos falando do mesmo ganho no tempo de resposta que, por exemplo, ao mudar de uma tela de 60 Hz para 144 Hz.

Por outro lado, o frame rate ainda pode ser excessivo, quando uma placa de vídeo mais potente apenas aquece o ar em vão e não ajuda mais a combater as já baixíssimas latências. Em todos os jogos 1080p que testamos, não encontramos nenhuma diferença significativa entre dispositivos como a GeForce RTX 2070 SUPER e a GeForce RTX 2080 Ti. O tempo mínimo absoluto de resposta registrado por nós é de 17,7 ms e foi obtido em DOTA 2. Este, aliás, não é um valor tão modesto, que, se traduzido em taxa de atualização, corresponde a 57 hertz. Portanto, a seguinte conclusão se sugere: os próximos monitores com uma frequência de 360 ​​Hz certamente encontrarão uso em jogos competitivos – esta é uma maneira direta de reduzir o atraso quando o hardware do computador já esgotou suas capacidades e depende das limitações da espessa pilha de software do sistema operacional, API gráfica, drivers e o próprio jogo.

Em seguida, verificamos se há algum benefício do software de controle de latência, que até agora se resume a limitar a fila de renderização de quadros em aplicativos que contam com as APIs de gráficos Direct3D 9 e 11 – o notório Radeon Anti-Lag no driver AMD e o modo de baixa latência da NVIDIA. Como se viu, ambas as “tecnologias” realmente funcionam, mas podem trazer benefícios tangíveis apenas em condições em que o gargalo do sistema seja a GPU, e não o processador central. Em nosso sistema de teste com um processador Intel Core i7-9900K com overclock, essas ferramentas ajudaram as placas gráficas baratas da categoria de desempenho intermediário (Radeon RX 5500 XT, GeForce GTX 1650 SUPER e aceleradores semelhantes da geração anterior), mas são completamente insignificantes quando há uma GPU poderosa. No entanto, quando as configurações anti-lag funcionam, elas podem ser extremamente eficazes, reduzindo a latência em um Overwatch em até 10 ms, ou 17% do original.

Finalmente, havia certas diferenças entre placas gráficas de diferentes fabricantes que não podiam ser previstas apenas pela taxa de quadros. Portanto, as placas de vídeo AMD às vezes fornecem a mesma latência curta que dispositivos “verdes” formalmente mais produtivos (exemplo: Radeon RX 5700 XT em CS: GO) e, em outros casos, funcionam suspeitamente lentos (o mesmo modelo em DOTA 2). Não ficaremos surpresos que, se as técnicas de medição de atraso de hardware como o LDAT se espalharem, os ciberatletas ávidos que estão lutando pela menor vantagem sobre seus rivais começarão a selecionar placas de vídeo para um jogo específico – dependendo de qual modelo oferece o menor tempo de reação.

Mas o mais importante, graças ao LDAT, temos a capacidade de realizar estudos mais profundos de latência. O que fizemos nesta prévia é apenas a ponta do iceberg. Tópicos como o impacto das tecnologias de sincronização adaptativa (G-SYNC e FreeSync) no atraso, limitação do FPS no jogo, dependência do desempenho da CPU e muito mais ainda estão além do escopo deste artigo. Além disso, vamos descobrir se uma alta taxa de quadros de centenas de FPS e, portanto, uma resposta rápida à entrada é alcançável, não apenas em jogos competitivos especialmente otimizados para esses critérios, mas também em projetos de classe AAA que carregam muito mais o sistema. Portanto, o jogador médio, e não o campeão, precisa de um monitor de última geração com taxa de atualização de 240 ou mesmo 360 Hz? Responderemos a essas perguntas em trabalhos futuros usando LDAT.

Deixe uma resposta

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *