Desde que as placas de vídeo para jogos existem, conhecemos uma medida definitiva do seu valor para o consumidor: FPS (fps). Mas por que as demandas dos consumidores levaram a que 60 FPS fossem considerados confortáveis, 30 FPS toleráveis e, para jogos competitivos, quanto maior a taxa de quadros, melhor? A razão é que a taxa de quadros é apenas um indicador indireto do atraso entre pressionar uma tecla e ver o resultado na tela. Se o FPS for muito baixo, as pessoas dizem que o jogo é “lento” ou “trava”. Ao mesmo tempo, quase ninguém reclama que filmes — arte desprovida de interatividade — ainda sejam filmados a 24 FPS, e que até mesmo as cenas de corte de jogos sejam frequentemente limitadas a 30 FPS.
O onipotente FPS decide o destino das placas de vídeo no mercado. Uma revista de informática escreverá que a placa “verde” topo de linha é 5% mais rápida que a “vermelha” desta vez e lhe dará uma medalha, enquanto a “vermelha” será criticada. No entanto, desde o advento da chamada geração de quadros, a taxa de quadros não está mais tão intimamente ligada ao seu significado prático. Vamos verificar o que realmente acontece com a latência de entrada quando a geração de quadros está em vigor e a taxa de quadros aumenta magicamente várias vezes.
⇡#Qual o problema com a geração de quadros?
Apesar dos cálculos complexos realizados internamente pelos algoritmos DLSS, FSR e XeSS, a geração de quadros se baseia em ideias simples. Renderizar um único quadro de um jogo consome uma quantidade significativa de tempo de CPU e GPU, o que, em última análise, determina a taxa de quadros. Mas e se renderizarmos dois quadros consecutivos de forma justa, comparássemos os resultados e…Interpolar o resultado intermediário? O recurso de inserção de quadros intermediários, presente em todas as TVs modernas, funciona de maneira semelhante. Ao contrário do ASIC de uma TV, a GPU opera com um conjunto de dados mais diversificado — como vetores de movimento dentro do mecanismo gráfico.
É importante observar que a geração de quadros, independentemente das especificidades de cada tecnologia proprietária, depende da interpolação, e não da extrapolação. Isso significa que um quadro gerado por DLSS, FSR ou XeSS reflete o estado dos objetos em movimento entre dois quadros que acabaram de concluir todo o pipeline de renderização. Consequentemente, o aumento observado na taxa de quadros (que pode ser significativo se vários quadros forem gerados em sequência) não reflete mais a capacidade de resposta do jogo. Além disso, toda a sequência de quadros deve ser exibida na tela com um atraso de um quadro “justo”, como demonstrado claramente pelo diagrama do pipeline FSR 3.

A tão comentada afirmação de Jensen Huang de que o modo de geração do DLSS prevê o futuro é falsa. Isso poderia, em certa medida, ser usado para descrever a tecnologia de assistência Reflex 2, que estreou com o DLSS 4 e utiliza uma técnica de distorção de quadros: imediatamente antes de enviar o quadro para o monitor, ele o modifica com base no último movimento do mouse. No entanto, até onde sabemos, nenhum jogo comercial jamais utilizou a segunda versão do Reflex.
De qualquer forma, mesmo que a interpolação da geração de quadros em si não exija recursos computacionais, essa tecnologia inevitavelmente aumenta o tempo de resposta do jogo à entrada do jogador. Seja uma solução algorítmica (como o FSR 3) ou uma rede neural (FSR 4, XeSS e todas as versões do DLSS), a geração consome alguns ciclos da GPU que poderiam ser usados para renderizar quadros “reais”, resultando em uma latência ainda maior.
A questão principal é quanto custa a geração de quadros, expresso em milissegundos de atraso. Para responder a essa pergunta, temos ferramentas de medição de latência de hardware que utilizam o padrão ouro — do clique ao fóton.
⇡#Equipamento de Teste, Metodologia de Teste
Entre os diversos jogos que suportam geração de frames, selecionamos quatro títulos unidos por uma característica comum: na plataforma AMD, eles utilizam nativamente a tecnologia FSR 4 para geração de frames (ou permitem forçá-la através das configurações do driver), que, diferentemente das versões anteriores, se baseia em uma rede neural. Ao mesmo tempo, todos os jogos testados são compatíveis com o pacote DLSS 4 da NVIDIA, incluindo a geração de múltiplos frames — pelo menos em 4x ou com a possibilidade de forçar o modo 6x através deAplicativo NVIDIA.
Os testes foram realizados com as placas de vídeo GeForce RTX 5070 Ti e Radeon RX 9070 XT, que oferecem desempenho muito similar em jogos rasterizados e jogos com renderização híbrida. As configurações dos jogos foram selecionadas para abranger uma ampla gama de taxas de quadros base (não geradas por quadros) — de pouco menos de 30 FPS a centenas de FPS.
Este artigo não teria sido possível sem um dispositivo chamado LDAT, criado por engenheiros da NVIDIA em 2020, muito antes da renderização gerada por quadros ser integrada ao DLSS. O LDAT é um sensor óptico e um mouse modificado controlado por um microcontrolador e um software especializado.
O dispositivo funciona fixando o sensor óptico em um ponto desejado no monitor, e o microcontrolador registra o tempo decorrido entre o pressionamento do botão esquerdo do mouse e a mudança no brilho da tela. Essa é a latência clique-fóton. O software LDAT foi executado em um host separado, que também estava conectado ao microcontrolador. Isso significa que o procedimento de medição não afeta o sistema de teste de forma alguma.

Os jogos de teste ideais para LDAT são jogos de tiro em primeira pessoa, onde uma animação curta e vívida do disparo ocorre em resposta a um clique esquerdo. No entanto, mesmo uma animação de disparo em jogos de tiro requer um certo número de quadros consecutivos, e se outras ações (como pular em jogos em terceira pessoa) forem usadas como gatilho visual, leva ainda mais tempo. Portanto, é importante ter em mente que os valores absolutos de latência obtidos com LDAT não têm significado por si só: a imagem pode ter respondido à entrada antes, mas a animação pode ter chegado à posição do sensor mais tarde.

O objetivo deste estudo foi diferente: avaliar como a latência clique-para-fóton se altera sob a influência da geração de quadros em cada um dos jogos de teste. Outras variáveis independentes incluíram a resolução da tela e a plataforma da GPU, ou seja, a tecnologia DLSS ou FSR. O monitor de teste operava com uma taxa de atualização de 240 Hz sem sincronização vertical ou controle dinâmico de taxa de atualização (FreeSync ou G-Sync).
Para cada combinação de variáveis independentes, foram obtidas 50 medições de latência (após a eliminação de outliers estatísticos) na mesma cena do jogo e com a mesma posição do sensor LDAT. A taxa de quadros também foi registrada por software.
O processamento dos dados foi realizado em duas etapas para cada combinação de jogo, marca da GPU e resolução da tela. Na primeira etapa, testamos a hipótese de que habilitar a geração de quadros (sem FSR) leva a um aumento estatisticamente significativo na latência, utilizando um teste U unilateral.
Na segunda etapa, um modelo de regressão linear múltipla foi construído para cada jogo. As variáveis independentes foram o comprimento da cadeia de frames gerados pela rede neural (incluindo um valor zero, correspondente à geração de frames desativada) e a taxa de quadros base sem geração de frames, bem como sua interação. A variável dependente foi a latência clique-fóton.
⇡#Resultados
Battlefield 6 (DLSS)
Como a série Battlefield mais recente perdeu o ray tracing, a placa de vídeo GeForce RTX 5070 Ti testada oferece altas taxas de quadros sem upscaling ou geração de frames — 150 e 107 FPS em resoluções relativamente baixas e quase 60 FPS em 4K. Além disso, jogos de tiro em primeira pessoa são os mais adequados para este jogo.Adequado para medições de latência de hardware devido às suas curtas sequências de animação de disparos.
Como resultado, Battlefield 6 demonstrou baixos valores de latência de base em comparação com outros títulos — latência mediana de 23,4, 27,8 e 40,5 ms, dependendo da resolução. A geração de um único quadro usando DLSS aumenta a latência mediana em 6,4 e 8,8 ms, respectivamente, em 1080p e 1440p, e em 17 ms em 4K. Em todos os três casos, a diferença é estatisticamente significativa, com um grande tamanho de efeito (r ≥ 0,78).
À medida que o número de quadros gerados por IA aumenta de 1 para 3, a latência aumenta linearmente, com o custo de cada quadro subsequente estimado em 1,73, 2,32 e 5,37 ms, respectivamente, em cada resolução de tela. No entanto, os modelos de regressão linear, neste caso, apresentam um baixo coeficiente de determinação (r² ≤ 0,17). Em termos simples, se a geração de quadros estiver ativada, o tempo de resposta do jogo aos comandos torna-se praticamente independente da quantidade de quadros consecutivos gerados pela rede neural.
Battlefield 6 (FSR)
A Radeon RX 9070 XT oferece taxas de quadros base comparáveis (132, 101 e 58 FPS) e latência mediana (26, 28,8 e 43,2 ms) às de sua concorrente em resoluções de tela de 1080p a 4K. Paradoxalmente, a geração de quadros usando a rede neural FSR 4 leva ao maior aumento na latência em 1080p — de 17,5 ms —, enquanto em resoluções de 1440p e 4K, a latência mediana aumenta apenas 10,7 e 13,4 ms, respectivamente. Em todos os três casos, a mudança na latência é estatisticamente significativa, com um grande tamanho de efeito (r ≥ 0,69).Cyberpunk 2077 (DLSS)
Cyberpunk 2077 é outro jogo que se encaixa bem em nossa metodologia de testes graças à sua curta duração.Animações de tiros. No entanto, ao contrário de Battlefield 6, os gráficos com ray tracing de Cyberpunk 2077 não permitem altas taxas de quadros em 4K — apenas 34 FPS. Resoluções mais baixas, por sua vez, resultam em taxas de quadros de 106 e 66 FPS, respectivamente. A latência mediana nos três modos é de 29,9, 38,1 e 61,5 ms.
Quando a geração de quadros DLSS é ativada, esses valores aumentam em 8,2, 14,5 e 28,9 ms. A diferença é estatisticamente significativa, com um grande tamanho de efeito (r ≥ 0,81).
O aplicativo NVIDIA permite aumentar a duração dos quadros gerados pela rede neural em Cyberpunk 2077 — até cinco. A relação entre a configuração FG e a latência observada é estatisticamente significativa, mas fracamente linear (r² ≤ 0,19), com o custo de cada quadro gerado subsequente sendo de 1,57, 2,02 e 3,63 ms, dependendo da resolução da tela.
Cyberpunk 2077 (FSR)
Com as mesmas configurações gráficas em Cyberpunk 2077, a Radeon RX 9070 XT “vermelha” atinge taxas de quadros base de 96, 59 e 28 FPS em três resoluções de tela. No entanto, os valores medianos de latência correspondentes são 37,5, 51,8 e 101,2 ms — significativamente maiores do que na plataforma NVIDIA. A geração de quadros, por sua vez, causa um aumento estatisticamente significativo e grande (r ≥ 0,78) na latência — de 8,4, 18,9 e 32,5 ms, respectivamente.
Hogwarts Legacy (DLSS)
Hogwarts Legacy acabou sendo o jogo de teste mais fácil para a GeForce RTX 5070 Ti e a Radeon RX 9070 XT, apesar da inclusão do ray tracing. Isso ocorre porque a geração de frames usando FSR não pode ser ativada separadamente do escalonamento de frames, então os testes em ambas as plataformas foram executados com o aprimoramento de qualidade ativado.Como resultado, a taxa de quadros nas três resoluções de tela começa em níveis elevados.264, 218 e 125 FPS, mas isso não garante baixa latência. Como Hogwarts Legacy não é um jogo de tiro em primeira pessoa, tivemos que usar o brilho do feitiço como gatilho visual, e o protagonista precisa primeiro acenar com a varinha. Isso resulta em latências medianas altas de 66,4, 63,7 e 68 ms, que são significativamente comparáveis entre as três resoluções.
Testes no modo 1080p produziram um resultado aparentemente contra-intuitivo: ativar o FG afeta a latência, mas com um pequeno efeito (r = 0,24), e o valor mediano não aumenta, mas diminui em 1,1 ms. Mesmo assim, nas resoluções 1440p e 2160p, observamos o aumento esperado na latência mediana de 5,9 e 9,5 ms, respectivamente, com um grande efeito (r ≥ 0,81).
A duração da sequência de quadros em Cyberpunk 2077 também pode ser aumentada para cinco quadros usando o aplicativo NVIDIA. A relação entre a duração da sequência e a latência é novamente estatisticamente significativa, mas a regressão linear tem um baixo coeficiente de determinação (r² ≤ 0,26). O custo de cada quadro subsequente gerado é de 0,92, 1,06 e 1,69 ms, dependendo da resolução da tela.
Hogwarts Legacy (FSR)
A Radeon RX 9070 XT alcançou taxas de quadros base de 270, 198 e 108 FPS. No entanto, o suporte a FSR 4 em Hogwarts Legacy requer configurações forçadas do driver e parece estar longe do ideal. Em 1080p e 1440p, o FSR proporciona um aumento de taxa de quadros significativamente menor do que o DLSS, mas a latência aumenta em 20,4, 23,3 e 24,7 ms, respectivamente, em todas as três resoluções. Novamente, a diferença é estatisticamente significativa e o tamanho do efeito é grande (r ≥ 0,86).Black Myth: Wukong (DLSS)
Por fim, Black Myth: Wukong é um jogo que exige muitos recursos, mesmo sem ray tracing: o originalAs taxas de quadros na GeForce RTX 5070 Ti nos três modos de teste foram de apenas 90, 68 e 40 FPS, respectivamente. Além disso, a latência clique-para-fóton provou ser a mais difícil de medir em Black Myth: Wukong devido à complexidade das animações do personagem principal. Os valores medianos de latência foram de 66,6, 68,8 e 83,3 ms, dependendo da resolução da tela.
Habilitar a geração de quadros DLSS resultou no aumento esperado na latência de 10,6, 7,4 e 22,1 ms, o que representa um efeito estatisticamente significativo e considerável (r ≥ 0,69).
No entanto, na faixa de taxa de quadros de 2x a 3x, apenas em 1440p o comprimento da cadeia de quadros gerados pela rede neural apresentou uma correlação positiva fraca (r² = 0,29), porém estatisticamente significativa, com a latência. Cada novo quadro gerado tem uma latência estimada em 4,2 ms. Nas resoluções 1080p e 4K, a direção da conexão se inverte, como pode ser visto nos gráficos: o modo mais custoso em termos de latência é o FG 2x.
Black Myth: Wukong (FSR)
A Radeon RX 9070 XT atinge taxas de quadros base de 93, 68 e 38 FPS, com latências medianas correspondentes de 64,7, 68,8 e 79,9 ms. No entanto, a geração de quadros usando FSR 4 custará aos usuários da Radeon RX 9070 XT 21,5, 28,4 e 61,3 ms adicionais de atraso, o que, mesmo por estimativa intuitiva, pode ser considerado o pior resultado em termos de experiência de jogo. O resultado é estatisticamente significativo e tem um grande tamanho de efeito (r = 0,86).
⇡#Conclusões
Nosso estudo não pretende abranger uma ampla gama de cenários envolvendo a geração de frames, e a medição da latência entre o clique e o fóton em jogos reais possui limitações inerentes.Mas mesmo nessas condições, conseguimos ir além da tarefa mínima – mostrar que, sob condições de geração de quadros, o valor de FPS perde seu significado anterior comoUm indicador de responsividade de um jogo.
Pior ainda, apesar do poder de processamento das GPUs modernas, a geração de frames usando uma rede neural é uma tarefa tão complexa que a latência entre o clique e a exibição do frame aumenta, chegando, por vezes, a dezenas de milissegundos. Além disso, há uma tendência de que quanto menor a taxa de quadros inicial, maior o atraso na geração de frames.
Em relação à geração de múltiplos frames usando DLSS versão 4, verifica-se que o custo da geração em si supera o custo adicional de cada frame subsequente. Existe uma relação linear entre o comprimento da cadeia de frames gerados e a latência, mas ela é mascarada por uma grande quantidade de ruído de medição.
Para avaliar qualitativamente os resultados obtidos, precisamos abordar a questão: qual aumento na latência é provavelmente perceptível para um jogador e quais valores são considerados aceitáveis? Infelizmente, esta é uma área de pesquisa à parte que vai muito além do escopo deste artigo. Mas aqui vai um exemplo para fins de discussão: a diferença entre uma taxa de atualização de 60Hz e 120Hz é de apenas 8,33ms, e todos conseguem perceber. Portanto, é razoável supor que, se a geração de quadros em um jogo adicionar o dobro da latência à latência base já significativa, isso também será perceptível.
Então, qual a faixa de taxa de quadros base que você deve buscar antes de habilitar a geração de quadros? Com base em nossos dados, qualquer valor abaixo de 60 FPS está simplesmente fora de questão, e 90-100 FPS é uma recomendação prática. Mas essa taxa de quadros já não é confortável o suficiente para arriscar lag e artefatos visuais?Parece que a geração de frames simplesmente carece de um caso de uso ideal onde os benefícios da tecnologia superem inegavelmente seus custos.
Por fim, a taxa de quadros é sempre visível, mas a latência entre o clique e o fóton não é tão facilmente mensurável. Consequentemente, ninguém notará falhas ocultas na implementação da geração de frames em certos jogos — como a correlação negativa entre o número de frames gerados e a latência em Black Myth: Wukong — ou a diferença (às vezes enorme) de latência entre DLSS e FSR.
Naturalmente, nada disso impedirá os fabricantes de GPUs de continuarem a usar as taxas de quadros obtidas com a geração de frames como métrica de desempenho em materiais de marketing. Mas esperamos ter lembrado aos leitores que o FPS em jogos, a base tradicional para comparações de placas de vídeo, é valorizado justamente por sua indicação indireta de latência e, de outra forma, é inútil.