Análise da placa de vídeo NVIDIA GeForce RTX 3080, parte 2: testes há muito aguardados

As mais recentes placas de vídeo da série GeForce RTX 30 estão muito atrasadas no caminho para a redação do 3DNews – tanto quanto nunca imaginamos enquanto trabalhamos na primeira parte da análise dedicada à arquitetura dos chips Ampere e todas as características dos dispositivos de consumo baseados neles. Mas agora os primeiros lotes da GeForce RTX 3080 finalmente fluíram para a Rússia em um fluxo fino, e tivemos a oportunidade de testar o RTX 3080 na prática, respondendo a todas as perguntas que preocupam os leitores, exceto uma: quanto os aceleradores avançados realmente custarão. Os planos das publicações de TI de publicar análises não são os únicos afetados pela pandemia. Diz-se que complicações nas relações entre Estados Unidos e China contribuíram para a escassez do RTX 3080, mas o principal culpado é a incrível empolgação em torno de novos produtos. É quase impossível simplesmente pegar e comprar uma GeForce RTX 3080. Os jogadores que correram para sair das mãos da GeForce RTX 2080 Ti, na melhor das hipóteses, terão que esperar na fila para pré-encomenda em qualquer uma das lojas online estrangeiras – os estoques lá acabaram dentro de algumas horas, se não minutos, após a NVIDIA dar o sinal verde no início das vendas e preçosnaturalmente (e muito) exceder aqueles recomendados por Santa Clara 99. Não é preciso dizer que o RTX 3080 na Rússia – pelo menos no início – será caro. Mas não foi em vão que os compradores correram para os novos aceleradores NVIDIA? É isso que vamos descobrir hoje.

Porém, avisaremos imediatamente que se você estiver interessado não apenas em analisar o desempenho da GeForce RTX 3080, mas também em conhecer as placas de vídeo Founders Edition, terá que esperar um pouco mais com isso. Os dispositivos de marca serão publicados depois das versões de parceiros do RTX 3080, embora isso seja verdade à sua maneira. Desta vez, Founders Edition está extremamente longe do que costumava ser chamado de placas de referência e é um produto limitado para apreciadores de beleza que nunca teria custado 99 no varejo se tivesse sido projetado e vendido por alguém dos parceiros da empresa em vez da NVIDIA.

Estamos muito satisfeitos que a GeForce RTX 3080 está apresentando o dispositivo Palit nos primeiros benchmarks no 3DNews. Sob esta marca, as modificações mais acessíveis de uma placa de vídeo específica no mercado russo apareceram mais de uma vez. E embora o RTX 3080 fundamentalmente não possa ser barato, o Palit GeForce RTX 3080 GamingPro OC irá demonstrar com o que um comprador pode contar, que no ambiente atual ainda pretende economizar dinheiro.

⇡#Especificações GeForce RTX 3080

Embora tenhamos prestado mais atenção às especificações oficiais das placas de vídeo GeForce série 30 na parte de arquitetura do teste, não faz mal lembrar aos leitores com que tipo de monstro estamos lidando na pessoa da GeForce RTX 3080 e da GPU GA102.

O chip GA102 totalmente funcional tem sete GPCs (Graphics Processing Cluster, os maiores componentes escaláveis ​​do array) contra seis no TU102. Cada um deles ainda contém 12 Multiprocessadores de streaming, apenas o conjunto de núcleos CUDA de 32 bits que processam números reais foi dobrado dentro do SM. Como resultado, a fórmula da unidade de execução principal GA102 inclui 10.496 núcleos CUDA compatíveis com FP32 e 336 unidades de mapeamento de textura.

No entanto, a GeForce RTX 3080 obteve uma versão significativamente reduzida do GA102, na qual existem apenas seis módulos GPC ativos restantes. Além disso, dois deles não estão totalmente equipados com SMs. Como resultado, a GeForce RTX 3080 tem 8.704 ALUs shader para operações FP32 e 272 unidades de mapeamento de textura. No entanto, esta ainda é uma grande reserva de poder de computação bruto em comparação com os principais modelos da série 20: a GeForce RTX 2080 SUPER e a RTX 2080 Ti têm apenas 3.072 e 4.352 núcleos CUDA FP32, respectivamente. Recomendamos que você vá para a primeira parte da análise para descobrir como a NVIDIA conseguiu espremer tantas ALUs de shader na matriz, sem ir além do já colossal orçamento de componentes de 28 bilhões de transistores.

Para satisfazer a necessidade do GA102 de acesso rápido aos dados, as placas de vídeo GeForce RTX 3080 e RTX 3090 são equipadas com um novo tipo de RAM GDDR6X, que, no caso do RTX 3080, fornece uma largura de banda de 19 Gb / s por pino de barramento versus 14 ou 16 Gigabit GDDR6, que prevalece nos aceleradores da geração anterior. Ao mesmo tempo, a largura de banda total da memória do RTX 3080, apesar do barramento cortado para 320 bits, chega a 760 GB / s. Mais – apenas para GeForce RTX 3090 (960 GB / s) e Radeon VII (1 TB / s). Apenas 10 GB de RAM podem causar pequenas preocupações, embora formalmente e de fato a GeForce RTX 2080 Ti mais fraca tenha 12 GB de VRAM.

Porém, o consumo real de memória on-board de uma placa de vídeo por jogos modernos é um tema delicado, que não é divulgado pelas estimativas de gigabytes ocupados no monitoramento de GPU-Z ou MSI Afterburner. Até agora, 10 GB de RAM GeForce RTX 3080 devem ser suficientes para qualquer tarefa de um usuário comum, incluindo jogos em uma tela de 4K com configurações de detalhes máximos. No entanto, a prática dos últimos anos sugere que para uma longa vida útil sem uma atualização, é melhor recrutar VRAM com uma margem. Não é à toa que versões da GeForce RTX 3080 com 20 GB GDDR6X já estão aparecendo no horizonte, o que, obviamente, fará ajustes adicionais ao quadro de preços da série 30. Também deixaremos além do escopo da análise uma questão como a influência de duas gerações diferentes da interface PCI Express no trabalho de novos tops NVIDIA. O consenso é que o PCIe 4.0 não traz nenhuma vantagem prática em jogos, embora dê à AMD mais uma oportunidade de destacar as vantagens da plataforma AM4. Os aplicativos profissionais, especialmente aqueles que podem usar várias GPUs ao mesmo tempo, são outra questão, mas deixaremos isso ao critério de especialistas em tarefas como aprendizado profundo.

Seja como for, os dados oficiais de desempenho da GeForce RTX 3080 são tais que o novo produto oferece o dobro da taxa de quadros em comparação com a versão base da GeForce RTX 2080 – em condições ideais para a arquitetura Ampere, ou seja, com resolução de 4K e traçado de raio. , mas mesmo assim. Pretendemos saber se o RTX 3080 atenderá a tal solicitação e, ao mesmo tempo, verificar qual é o consumo real de energia do acelerador. O que quer que se diga, as placas de jogos de chip único NVIDIA pela primeira vez ultrapassaram a marca de 300 W e, afinal, o RTX 3080 nem mesmo é o carro-chefe da série. Mas primeiro, vamos dar uma olhada mais de perto na placa de vídeo, que teve a honra de apresentar uma nova arquitetura nos primeiros testes – Palit GeForce RTX 3080 GamingPro OC.

⇡#Palit GeForce RTX 3080 GamingPro OC: construção, conjunto de entrega

Os parceiros NVIDIA e AMD não gostam de lançar placas de vídeo desprovidas de, pelo menos, overclock nominal. É por isso que Pait GamingPro carrega o índice OC em seu nome, porque o processador gráfico nele, embora um pouco, ainda está com overclock. O overclocking é reduzido a 30 MHz adicionais da frequência do clock de design sob a carga do jogo (Boost Clock), então as especificações do acelerador podem ser comparadas à referência de um ponto de vista prático.

Ainda mais impressionante é o sistema de refrigeração que Palit instalou no chip GA102. A placa de vídeo ocupa três slots de expansão completos no gabinete do PC, o que longe de todas as variedades de GeForce RTX 2080 poderia pagar, incluindo aqueles com overclock de mais de Pait GamingPro. Não é à toa que a empresa fixou um suporte de acrílico ao seu produto, que mantém a borda livre da placa na posição horizontal.

Porém, o cooler da versão Palita da GeForce RTX 3080 é interessante não apenas por suas dimensões. Quando todos os olhos estão voltados para as placas de vídeo Founders Edition, que estabelecem padrões, se não na eficiência do resfriamento (descobriremos no devido tempo), então certamente na estética, parceiros da NVIDIA que não podem gastar mais de 50 em um cooler sozinho (rumores , esse é exatamente o valor que a produção de CO para uma placa da Founders Edition custa), tende a se destacar da multidão.

Quando visto de frente, o Palit GeForce RTX 3080 GamingPro OC não é nada extraordinário: parece que temos um cooler normal com três ventoinhas com diâmetro de 95 mm, mas muito grosso. Há também uma luz de fundo RGB quase obrigatória para placas de vídeo modernas de alto desempenho.

Mas se você virar a placa de vídeo, pode ter certeza de que o fluxo de ar da ventoinha certa passa pelo dissipador de calor e pela placa na parte de trás do PCB – exatamente como na Founders Edition. Não ficaremos surpresos se outros fabricantes seguirem o exemplo da NVIDIA neste detalhe, não tanto pelo desejo de imitar o criador de tendências, mas porque o circuito dos aceleradores com memória GDDR6X exige a colocação de chips de RAM o mais próximo possível da GPU e, portanto, os elimina em curto circuitos impressos. Já vimos essa abordagem para o projeto do sistema de resfriamento uma vez executado pela SAPPHIRE – também com base em um curto PCB de aceleradores Radeon R9 Fury.

A propósito, não podemos deixar de elogiar Palit pelo fato de que a placa na parte superior do PCB não é feita de plástico inútil e até prejudicial para o resfriamento, mas de alumínio e é pressionada contra o PCB por meio de várias almofadas térmicas.

Sob a caixa do sistema de refrigeração, há um radiador de duas seções bastante típico, talvez ajustado para as dimensões, perfurado por vários tubos de calor grossos. Uma base de cobre niquelado remove o calor do cristal da GPU e os chips de memória e os estágios de energia VRM estão em contato com uma estrutura de metal maciça.

O cooler GeForce RTX 3080 GamingPro OC parece um potente para uma placa de vídeo com um consumo de energia nominal de 320 W e, como podemos ver, tem alta eficiência e baixo ruído. Quando a temperatura da GPU está abaixo de 60 ° C, ela não precisa de resfriamento ativo e os ventiladores param de girar. A única reclamação que pode ser feita sobre o design desta placa de vídeo (e de muitas outras também) é que o sistema de refrigeração deixa todo o ar quente gasto dentro do gabinete do micro. Com tal dispositivo, quando as aletas do radiador correm paralelas à grade no final da caixa, ele poderia muito bem ter sido substituído por uma placa em branco com recortes apenas para conectores de saída de vídeo – nada teria mudado disso.

Falando das saídas de vídeo da GeForce RTX 3080, a falta de um conector USB Type-C com suporte para DisplayLink, que é típico dos aceleradores da 20ª série, não é uma medida de economia por parte da Palit. Este padrão, projetado para conectar fones de ouvido VR com um único fio, como dizem, não decolou e acabou sendo rejeitado pela NVIDIA.

⇡#Palit GeForce RTX 3080 GamingPro OC: PCB

Como mencionamos no início, é incorreto chamar as versões Founders Edition da série GeForce 30 como dispositivos de referência. No entanto, a NVIDIA fornece aos parceiros um design de PCB de referência real para ajudar a organizar o lançamento de placas de vídeo de primeira onda com sistemas de resfriamento proprietários e, sob o cooler de um acelerador de orçamento, às vezes você pode encontrar a própria placa-mãe de referência com as marcas NVIDIA. O PCB Palit GeForce RTX 3080 GamingPro OC é praticamente o mesmo: as fotos de mais alguns PCBs para chips GA102 que surgiram na Internet são semelhantes ao que você vê nas fotos, e são obviamente variações do mesmo tema.

Seja como for, para o comprador médio não interessado em overclocking competitivo, dificilmente há uma razão para encontrar uma falha na placa RTX 3080 GamingPro OC. O design de referência permite a fonte de alimentação de 16 fases da GPU usando dois controladores de oito fases On Semiconductor NCP81610, embora neste caso apenas cinco estágios de alimentação de um VRM sejam soldados na placa. A memória GDDR6X é alocada em quatro fases, mas os componentes de duas delas, novamente, estão faltando. As fases de alimentação da GPU são alimentadas por estágios de alimentação AOZ5311NQI da Alpha e Omega com uma corrente nominal de 50 A.

A PCB Palit GeForce RTX 3080 GamingPro OC não precisa de mais comentários. Os aceleradores Founders Edition atendem a um VRM que consiste em um total de 18 fases, eles usam exclusivamente capacitores de estado sólido, mas entre as variedades parceiras do RTX 3080 e do RTX 3090 veremos este projeto mais de uma vez – um design mais barato, mas bem equipado.

⇡#Suporte de teste, metodologia de teste

Na maioria dos jogos de teste, as taxas de quadros média e mínima são derivadas de uma série de tempos de renderização de quadros individuais, que são registrados pelo benchmark integrado (ou pelo utilitário OCAT, se não estiver disponível).

A taxa média de quadros nos gráficos é o recíproco do tempo médio de quadros. Para estimar a taxa de quadros mínima, o número de quadros formados a cada segundo do teste é calculado. Desta matriz de números, seleciona-se o valor correspondente ao 1º percentil da distribuição. Red Dead Redemption 2 é uma exceção: seu benchmark integrado registra o primeiro percentil do tempo de renderização do quadro, do qual a taxa de quadros correspondente é derivada.

A potência das placas de vídeo é gravada separadamente da CPU e de outros componentes do PC usando um amperímetro JUNTEK VAT-1050 e um dispositivo NVIDIA PCAT. Para medir simultaneamente a corrente que passa pelos conectores de alimentação auxiliares e pelo slot da placa-mãe, a placa de vídeo é conectada por meio de um riser PCI Express x16 rígido, no qual as linhas de alimentação são interrompidas e levadas para um cabo separado.

O Crysis 3 é usado como uma carga para testes de potência e ruído com uma resolução de 3840 × 2160 sem anti-aliasing de tela cheia e com configurações máximas de qualidade gráfica, bem como um teste de estresse FurMark com as configurações mais agressivas (resolução 3840 × 2160, MSAA 8x). Todos os parâmetros são medidos após o aquecimento da placa de vídeo, quando a temperatura da GPU e a velocidade do clock se estabilizam.

⇡#Participantes do teste

As seguintes placas de vídeo participaram do teste de desempenho:

  • Palit GeForce RTX 3080 GamingPro OC (1440/1740 MHz, 19 Gb / s, 10 GB);
  • NVIDIA GeForce RTX 2080 Ti FE (1350/1645 MHz, 14 Gb / s, 11 GB);
  • NVIDIA GeForce RTX 2080 SUPER FE (1650/1815 MHz, 15,5 Gb / s, 8 GB);
  • NVIDIA GeForce GTX 1080 Ti FE (1480/1582 MHz, 11 Gb / s, 11 GB);
  • NVIDIA GeForce GTX 1080 FE (1607/1733 MHz, 10 Gb / s, 8 GB);
  • AMD Radeon RX 5700 XT (1605/1905 MHz, 14 Gb / s, 8 GB);
  • AMD Radeon VII (1400/1750 MHz, 2 Gb / s, 16 GB).

Aproximadamente. As frequências base e boost de acordo com as especificações de cada dispositivo são indicadas entre colchetes após os nomes das placas de vídeo. Placas de vídeo de design não referencial são trazidas de acordo com os parâmetros de referência (ou próximos a estes), desde que isso possa ser feito sem edição manual da curva de freqüência do clock. Caso contrário (aceleradores NVIDIA GeForce série 16, bem como GeForce RTX 2070/2080/2080 Ti Founders Edition), as configurações do fabricante são usadas.

⇡#Velocidades de clock, consumo de energia, temperatura, ruído e overclocking

Antes de prosseguir com os benchmarks Palit RTX 3080 GamingPro OC, gostaríamos de informá-lo sobre a reposição em nosso kit de ferramentas de teste. Junto com o kit LDAT, que registra a latência entre a entrada da imagem e a resposta nos jogos, recebemos da NVIDIA uma nova ferramenta de medição de consumo de energia para placas de expansão PCI Express chamada PCAT (Power Capture Analysis Tool).

A maioria das análises de aceleradores gráficos usam métodos indiretos para avaliar o consumo de energia – usando ferramentas de software do driver da placa de vídeo ou mais frequentemente pela potência total do computador – que não permitem uma comparação precisa de dispositivos de diferentes fabricantes e calculam tal indicador como desempenho por watt, caracterizando novas conquistas Design de GPU. Por exemplo, placas de vídeo modernas baseadas em chips NVIDIA são capazes de enviar dados através da API sobre seu consumo total de energia (incluindo RAM, ventiladores e perdas de eficiência para conversão de tensão) devido ao fato de usarem shunts em todas as linhas de 12 V para controlar a energia. Ao mesmo tempo, o sistema de alimentação para aceleradores AMD é mais simples e permite que você monitore apenas a potência da GPU na saída dos estágios de potência VRM sem levar em consideração outros componentes. Bem, as medições da potência total do sistema com um wattímetro doméstico, obviamente, não permitem excluir da equação a carga desigual do processador central ao usar uma GPUdiferentes classes de desempenho.

A única maneira de eliminar essas limitações de uma vez por todas é isolar a fonte de alimentação da placa de vídeo da placa-mãe da bancada de teste e controlar a corrente diretamente entre o dispositivo experimental e a fonte de alimentação. Em análises de novas GPUs, temos seguido esse método há vários anos, quando uma placa de vídeo é conectada à placa-mãe com um riser rígido, no qual as linhas de força estão quebradas e toda a corrente e, portanto, o consumo de energia é medido por um wattímetro digital universal usando um shunt projetado para várias centenas watt.

A ferramenta PCAT funciona exatamente da mesma maneira. Ele consiste em uma placa microcontrolada com conectores de alimentação PCI Express de oito pinos e um adaptador que isola a placa de vídeo da placa-mãe. Assim, toda a energia é fornecida ao acelerador através do PCAT, e o microcontrolador registra a corrente que passa pelos cabos e pelo slot PCI Express. Para estimar o consumo de energia a olho nu, o PCAT tem uma tela OLED em miniatura, mas ao contrário do nosso wattímetro, um dispositivo NVIDIA pode ser conectado a um computador via USB e registrar um registro do consumo de energia – o total ou, se necessário, a energia do slot PCI Express e conectores de energia adicionais separadamente.

Observe que o software PCAT, como o LDAT, não precisa ser executado em um computador de teste e, no caso de ser executado em uma máquina separada, o PCAT não tem como saber qual hardware estamos testando. Conseqüentemente, não há necessidade de se preocupar se os aceleradores AMD receberão classificações de potência justas em comparação com os novos produtos NVIDIA. Em termos de precisão de medição, as medições PCAT do consumo de energia de placas de vídeo sob carga não se desviaram de nossos próprios instrumentos, calibrados para uma queda de tensão no shunt, em mais de 2%. Portanto, no início podemos operar com segurança com dados novos e antigos misturados, mas nas análises de todas as GPUs futuras, iremos mudar completamente para o PCAT. No final das contas, a ferramenta NVIDIA é muito mais conveniente de usar, sem mencionar que parece muito mais agradável do que nossos produtos caseiros.

No entanto, de volta ao Palit RTX 3080 GamingPro OC. Como já observamos, temos diante de nós uma versão com overclock da GeForce RTX 3080, mas o overclock neste caso se reduz a um valor puramente simbólico de 30 MHz na frequência do Boost Clock, e a reserva de energia da placa de vídeo corresponde à referência de 320 watts. Como resultado, o overclock de fábrica da placa de vídeo não deve distorcer o quadro geral da comparação da GeForce RTX 3080 com outros aceleradores, todos representados nos benchmarks por modelos de referência.

A NVIDIA estima a faixa de velocidade de clock do GeForce RTX 3080 de forma mais conservadora do que seus predecessores formais, o RTX 2080 e o RTX 2080 SUPER. Na verdade, é, embora a distância entre a velocidade de clock do núcleo estável do Palit RTX 3080 GamingPro OC e o GeForce RTX 2080 SUPER Founders Edition acabou sendo um pouco mais de 50 MHz (1854 e 1907 MHz, respectivamente) sob uma carga poderosa no Crysis 3. Sim, fizemos Ainda usamos este jogo como um teste de estresse: basta dizer que o RTX 3080 foi o primeiro acelerador em nossa prática a atingir 60 FPS com resolução de 4K no Crysis 3 (mesmo sem anti-aliasing de tela cheia MSAA!). Mas em comparação com o chip TU102 na placa GeForce RTX 2080 Ti, a nova GPU tem uma freqüência de 131 MHz mais alta, apesar da diferença de uma vez e meia nos orçamentos dos transistores. A única pena é que as ferramentas universais de software para monitoramento e overclock de placas de vídeo ainda não obtiveram acesso aos sensores de tensão de alimentação da GPU, para que possamos descobrir como a mudança na tecnologia de processo afetou este parâmetro.

É irônico que a NVIDIA tenha distribuído (para selecionar edições de TI, mas mesmo assim) kits para medir a potência dos aceleradores precisamente em um momento em que seus dispositivos de consumo atingiam TDPs elevados sem precedentes. Mas talvez o fato seja que testaremos a potência do Ampere na prática e nos certificaremos de que não seja tão terrível quanto resulta de suas características oficiais de desempenho. Infelizmente, pelo menos o Palit RTX 3080 GamingPro OC realmente consome pelo menos 314 dos 320 watts de potência exigidos de acordo com o passaporte. A única placa de vídeo, além dos dispositivos de “duas cabeças”, em nosso banco de dados, que supera o RTX 3080 em potência, é a Radeon RX Vega 64 com o LSS padrão e todos os modelos NVIDIA anteriores (incluindo RTX 2080 SUPER 250 watts e RTX 2080 Ti ) a novidade que ficou para trás.

Com um consumo de energia tão impressionante e, conseqüentemente, dissipação de calor da GPU, devemos prestar homenagem ao sistema de refrigeração Palit. Temperaturas dentro de 70 ° C sob carga ainda não são um sinal de qualidade – é apenas como os refrigeradores automáticos são configurados, mas manter o nível de ruído em 38 dBA (mais baixo que o dos modelos anteriores da Founders Edition da geração anterior) é muito mais difícil.

Aproximadamente. Todos os parâmetros são medidos após o aquecimento da GPU e a estabilização das frequências do clock.

Não tínhamos grandes esperanças de fazer overclock da GeForce RTX 3080 e, como a experiência mostrou, a placa de vídeo realmente não se presta a overclock, o que se expressa em qualquer aumento significativo no desempenho dos jogos. Para começar, o firmware Palit GamingPro OC permite apenas um aumento de 9% na reserva de energia da placa, que é o principal obstáculo para aumentar a velocidade do clock da GPU. E dentro da estrutura do TDP estabelecido, a automação GPU Boost já está praticamente esgotando o potencial de frequência. Fomos capazes de adicionar 50 MHz ao Boost Clock de design, que se traduz em 85 MHz de velocidade de clock real sob carga de jogos (5% dos 1854 MHz originais). Desnecessário dizer que esta é uma gota no oceano que dificilmente afetará até mesmo os benchmarks mais sensíveis. Além disso, fazer overclock no núcleo gráfico acarreta um aumento no já extremamente alto consumo de energia em 19 W – felizmente, pelo menos sem as consequências para a temperatura e ruído do sistema de refrigeração.

Talvez seja mais lucrativo fazer overclock da RAM na GeForce RTX 3080? Há uma base para overclock dos chips GDDR6X com largura de banda nominal de 19 Gbps, que são usados ​​na GeForce RTX 3080, mas não é tão fácil de revelar. Para encontrar o limite dos chips GDDR6 padrão com temporizações inalteradas, é suficiente aumentar gradualmente a freqüência do clock até que a placa de vídeo perca estabilidade ou artefatos gráficos apareçam na tela. O GDDR6X se comporta de forma insidiosa: no início conseguimos trazer a taxa de transferência dos chips para 21,8 Gb / s por contato, mas logo descobrimos que quanto mais vai além de 21,2 Gb / s, mais não aumenta, mas pelo contrário, o desempenho diminui … Talvez tenham entrado em cena os mesmos algoritmos de ajuste de sinal no barramento GDDR6X de que falou a NVIDIA, que mantêm a estabilidade mesmo em condições de severa degradação da relação sinal-ruído.

A propósito, o GPU-Z e programas semelhantes determinam incorretamente a frequência de comando GDDR6X em 1.188 MHz, embora na verdade seja o dobro. Se esse erro não for corrigido no futuro, adquira o hábito de multiplicar o número por 16, e não por 8, como no GDDR6, para obter a taxa de transferência final dos chips.

⇡#Testes de jogos (1920 × 1080)

Leitores regulares da seção de ferro do 3DNews provavelmente notaram que a composição da metodologia de teste para novas GPUs mudou muito. Excluímos a carga sintética do programa – tanto 3DMark na seção de renderização 3D de jogos quanto testes de computação de uso geral semelhantes. Sim, o 3DMark é bom para avaliar rapidamente a diferença entre placas de vídeo com características semelhantes. Mas quando se trata de uma nova geração de processadores gráficos, que afirma ter um nível de desempenho qualitativamente diferente, não faz sentido estudar “papagaios” no 3DMark. Há muito deixou de ser uma alternativa aos jogos baseados em diferentes motores gráficos e trabalhando com diferentes APIs, e às vezes está em desacordo com a realidade nas estimativas de GPU de uma determinada arquitetura. Os benchmarks de escala Ray-traced e DLSS no 3DMark fizeram um bom trabalho ao ilustrar os recursos dos aceleradores GeForce RTX série 20 em seus primeiros meses, mas agora, além dos jogos que usam recursos de renderização “híbrida”, existem modificações totalmente rastreadas do Quake II e do Minecraft. Como resultado, decidimos abolir os testes no 3DMark eem vez deles, expanda o arsenal de jogos reais, que agora consiste em metade de projetos que suportam traçado de raios de uma forma ou de outra.

Por outro lado, é necessário explicar por que a lista de testes não inclui algumas inovações em jogos de 2020, que se distinguem pela alta demanda de hardware e à primeira vista são ideais para testar dispositivos como a GeForce RTX 3080. Estamos falando de Horizon Zero Dawn e Microsoft Flight Simulator. ao qual testes comparativos em grande escala são dedicados no 3DNews. O fato é que ambos os jogos foram lançados para PC há relativamente pouco tempo, e até agora eles não se distinguem pela alta estabilidade em geral e desempenho em particular. Não estamos dispostos a arriscar a repetibilidade dos resultados de benchmark para garantir que o método de teste consiste nos jogos mais recentes, então Horizon Zero Dawn e MSFS terão que esperar na fila até que a primeira onda de correções de bugs seja concluída.

Então, vamos proceder à análise dos resultados do teste na resolução inicial de 1080p, o que, francamente, é completamente inadequado para liberar o potencial dos aceleradores da classe GeForce RTX 3080. É uma pena, porque é neste modo que o hardware moderno pode desenvolver taxas de quadros acima de 100 FPS. apenas em jogos de esportes leves, mas também em projetos AAA exigentes, que têm um efeito positivo no tempo de reação – especialmente em uma tela de alta frequência. Recentemente, examinamos esse problema separadamente durante o teste de latência de hardware usando LDAT e chegamos à conclusão de que é útil aumentar o FPS além da taxa de atualização do monitor, mesmo se você tiver uma matriz ultrarrápida de 240 Hz. Infelizmente, entre os jogos de teste, apenas DOOM Eternal e Strange Brigade são uma exceção tão feliz.

No entanto, mesmo em tais condições, a GeForce RTX 3080 oferece um aumento significativo de 23% na taxa de quadros média em comparação com o antigo carro-chefe das placas de vídeo de consumidor NVIDIA, a GeForce RTX 2080 Ti, e quando comparada com a RTX 2080 SUPER, estamos falando de 38% FPS adicionais. Finalmente, os modelos mais antigos da geração anterior – GTX 1080 e GTX 1080 Ti – superam o novo produto em até 110 e 67%, respectivamente. Desnecessário dizer sobre os topos “vermelhos” antes do próximo lançamento dos chips Navi da segunda onda: a GeForce RTX 2080 derrotou a Radeon VII e a Radeon RX 5700 XT com uma vantagem de 64 e 69%.

⇡#Testes de jogo (2560 × 1440)

A transição para uma resolução de 1440p permitiu que placas de vídeo poderosas respirassem mais livremente, mas a relação entre a GeForce RTX 3080 e os modelos mais antigos da série RTX 20 não mudou fundamentalmente. O acelerador baseado em Ampere supera o GeForce RTX 2080 SUPER e RTX 2080 Ti em FPS médio por 46 e 29%, respectivamente. É outra questão se você comparar o RTX 3080 com a geração anterior de placas de vídeo NVIDIA: a diferença entre a GeForce GTX 1080 e a GTX 1080 Ti aumentou para impressionantes 134 e 79%. O mesmo se aplica aos aceleradores “vermelhos” da categoria médio-alto de preços baseados na moderna arquitetura RDNA, apresentados pela Radeon RX 5700 XT: o RTX 3080 supera este último em 80% FPS.

⇡#Testes de jogos (3840 × 2160)

Os testes na tela 4K devem acabar com a comparação dos aceleradores da série 30 com seus predecessores imediatos. Nessas condições, são os gráficos, não o processador central, que se tornam o gargalo do sistema. Além disso, como os modelos mais antigos da geração Turing são considerados placas de vídeo adequadas para uma resolução de 2160p, todos os três novos produtos da GeForce RTX 3070 ao RTX 3090 devem assumir seu comando.

No entanto, os gráficos do jogo também estão avançando. Embora não usemos mais o MSAA de tela cheia com uso intensivo de recursos e tipos semelhantes de anti-aliasing, que são amplamente suplantados pelas versões leves do TAA, em apenas seis dos dez projetos de teste, a taxa de quadros média na GeForce RTX 3080 excedeu 60 FPS. Sete anos se passaram desde que a NVIDIA e a AMD abriram oficialmente a era dos jogos 4K, e ainda é impossível salvar jogos avançados na velocidade máxima com muletas na forma de dimensionamento de quadros usando DLSS ou FidelityFX CAS. Embora, para ser justo, entre todos os jogos apenas em Total War: THREE KINGDOMS – outra série de estratégia sempre desacelerando – o novo acelerador não manteve a taxa de quadros pelo menos 50 FPS.

O que quer que se diga, o RTX 3080 ainda deu um grande passo em direção ao objetivo de tornar o 4K um modo jogável incondicionalmente, alcançando uma vantagem de 55% sobre o GeForce RTX 2080 SUPER. Claro, isso ainda não é um crescimento recorde no desempenho entre as gerações de GPU, já que os aceleradores da família Pascal se destacaram: por exemplo, a GeForce GTX 1080 nas mesmas condições acabou sendo 72% mais rápida do que a GeForce GTX 980. No entanto, deve-se levar em consideração o fato de que naquela época os fabricantes de chips deram um salto gigante na tecnologia de GPU da fotolitografia de 28nm para 14 / 16nm. É improvável que testemunhemos tal aumento no desempenho em um futuro previsível, a menos que a TSMC e a Samsung enfrentem outra crise de dimensionamento do transistor. Por outro lado, vale a pena considerar que, ao contrário da GeForce RTX 2080 e RTX 2080 SUPER, a nova GeForce RTX 3080 é baseada em um chip de primeira linha, embora bastante reduzido em termos de número de unidades de execução ativas, por isso a demanda dele é maior do que do mesmo RTX 2080, que conseguiu oferecer apenas 37% mais FPS em comparação com sua predecessora direta, a GeForce GTX 1080.

Curiosamente, a diferença entre a GeForce RTX 3080 e a GeForce RTX 2080 Ti é estimada em 37% da taxa de quadros média. É improvável que mesmo esses números convençam os usuários do antigo modelo top da necessidade de uma atualização urgente (leitores empreendedores irão acrescentar que o RTX 2080 Ti teve que ser eliminado com antecedência antes que os preços entrassem em colapso), mas a perspectiva de substituir a GeForce GTX 1080 ou mesmo a GeForce GTX 1080 Ti parece extremamente atraente no RTX 3080 para jogos em 4K. O que quer que se diga, é perto de 60 FPS em jogos incrivelmente pesados ​​como Red Dead Redemption 2, com qualidade gráfica máxima, mas em todos os outros casos, o RTX 3080 supera os modelos mais antigos da família Pascal em uma taxa de quadros média de 2-2,5 vezes.

⇡#Testes de jogos com overclock

Os míseros 5% de taxa de quadros da GPU que conseguimos extrair do Palit RTX 3080 GamingPro OC em tentativas de overclock não deve ter nenhum impacto significativo no desempenho dos jogos. A RAM GDDR6X do RTX 3080 revelou-se um alvo mais promissor para overclock: no final, conseguimos aumentar sua largura de banda de 19 para 21,2 Gb / s por pino de barramento, o que é até 16% de suas características padrão. Como resultado, se pudermos encontrar qualquer informação útil nos benchmarks do RTX 3080 com overclock, será a resposta à pergunta se o chip GA102 aparado tem largura de banda de memória total suficiente de 760 GB / s, que a NVIDIA forneceu.

Como se viu, o suficiente, e provavelmente com uma grande margem. Em quase todos os testes com resolução de 4K, a largura de banda de memória adicional e uma GPU com overclock simbólico trouxeram à GeForce RTX 3080 exatamente 1% da taxa de quadros (o que, aliás, fala da confiabilidade do método de teste, no qual incluímos jogos com desempenho mais estável). Desnecessário dizer que em uma resolução mais baixa, o overclocking será completamente coberto pela dependência dos jogos do processador e pelo erro de medição. Não excluímos que no futuro ainda encontraremos opções para a GeForce RTX 3080 que são favoráveis ​​ao overclock, mas agora podemos prever que, além dos casos mais extremos, esta é uma tarefa inútil.

Testes de jogos com rastreamento de raio. Cálculos para fins gerais. Codificação / decodificação de vídeo. Tabelas de resultados. conclusões

⇡#Testes de jogos Ray-tracing

A GeForce RTX 3080 já demonstrou um aumento significativo de desempenho em benchmarks com a renderização de rasterização 3D tradicional, mas esperávamos obter os resultados mais brilhantes em testes de rastreamento de raio de jogos. No final das contas, é o reflexo da velocidade de rastreamento de raios que deve ser a culminação de todas as mudanças que a NVIDIA fez na arquitetura Ampere.

E assim aconteceu. Além do dimensionamento de quadro DLSS, o RTX 3080 é muito mais capaz de lidar com a explosão de carga computacional que o traçado de raio causa. Como resultado, há uma distância significativa entre o novo produto e os aceleradores de ponta da 20ª série, mesmo em uma resolução relativamente baixa de 1080p: de acordo com os resultados de seis benchmarks, o RTX 3080 é 48% melhor que o GeForce RTX 2080 SUPER e 27% – o RTX 2080 Ti. Movendo-se ainda mais em direção a 1440p, a lacuna se amplia para 55 e 34%, respectivamente, e atinge o pico de 4K em 69 e 39%. Agora estamos finalmente lidando com um aumento de desempenho de acordo com os padrões de ouro da arquitetura Pascal!

No entanto, a força do Ampère não é tanto relativa quanto em números absolutos. Com uma resolução de 1440p, o traçado de raio impediu que a GeForce RTX 3080 ganhasse uma posição a 60 FPS apenas no benchmark Metro Exodus, e até mesmo as modificações Quake II RTX e Minecraft totalmente rastreadas foram digeridas pelo acelerador sem problemas. Claro, ainda é prematuro falar sobre a possibilidade de jogar com ray tracing e sem freios em 4K justo, mas graças à GeForce RTX 3080, isso se tornou possível pelo menos no Battlefield V e, com algum trecho, no Shadow of the Tomb Raider.

Felizmente, quase todos os jogos que suportam DXR (ou bibliotecas de rastreamento de raio na API Vulkan) permitem o uso de DLSS simultaneamente. A tecnologia para dimensionar quadros usando uma rede neural percorreu um longo caminho desde as primeiras implementações francamente malsucedidas no Battlefield V e Metro Exodus e aprendeu a produzir uma imagem que dificilmente pode ser distinguida a olho nu de uma renderização de quadro inteiro honesta. Mas em tais condições, as conquistas da GeForce RTX 3080 não são mais tão impressionantes quanto o que vimos antes. Nem todos os jogos permitem que você habilite DLSS em aceleradores potentes com uma resolução de tela abaixo de 1440p ou 2160p (daí os zeros nas tabelas finais), mas uma regra sempre se aplica: GeForce RTX 2080 e RTX 2080 Ti, graças ao DLSS, são puxados para a GeForce RTX 3080 para que em 4K a vantagem novos itens antes de seus predecessores são comprimidos para 52 e 30%, respectivamente. Este ainda é um resultado forte, mas 69 e 39% dignos do notório Pascal estão fora de questão.

⇡#Computação de uso geral

Placas de vídeo baseadas em chips de Turing tiveram bom desempenho em tarefas relacionadas a cálculos de uso geral. Apesar da orientação para jogos da série 20 GeForce, era no campo das GP-GPUs, onde a lógica GCN da AMD era a clara favorita antes, esta arquitetura trouxe os maiores dividendos. Desta vez, a NVIDIA é obrigada a pelo menos consolidar e, na melhor das hipóteses, repetir o sucesso passado, porque o poder de computação bruto do Ampere, graças a um grande número de ALUs shader e unidades de rastreamento de raios retrabalhadas, atingiu um nível completamente diferente.

Nem todos os aplicativos são igualmente eficientes no uso de recursos de GPU, mas já no Adobe Premiere Pro, o novo acelerador pode reduzir significativamente o tempo de renderização de vídeo 4K com efeitos gráficos complexos em comparação com estações de trabalho na GeForce RTX 2080 SUPER, e a diferença entre Ampere e Pascal é bastante simples colossal (placas de vídeo “vermelhas”, como esperado, suportam melhor). Observe que este teste não usa a capacidade de codificar H.264 e H.265 pelo mecanismo de mídia de hardware NVENC – estamos interessados ​​apenas no desempenho da GPU em si.

O melhor de tudo é que o poder da arquitetura Ampere é revelado por tarefas de ray tracing offline, como renderização no Blender no motor Cycles. Aqui, a GeForce RTX 3080 demonstrou mais do que uma vantagem dupla na velocidade de renderização de cena em relação a Turing e Radeon VII, seja renderizada usando núcleos RT ou exclusivamente por software. No entanto, o mecanismo Radeon ProRender, que usamos como uma alternativa para renderizadores estritamente baseados em blocos como Cycles, não ficou tão impressionado com as conquistas de Ampere.

Aproximadamente. Para testar novas placas de vídeo, mudamos para a versão atual do Blender – 2.9 – e descobrimos que a Radeon RX 5700 XT novamente perdeu a capacidade de funcionar com o motor Cycles.

Finalmente, vamos comentar sobre os resultados de um benchmark que usa não apenas ALUs shader da GPU, mas também núcleos tensores – neste caso, para debayering gravações de vídeo filmadas com uma câmera RED profissional. Aqui não esperávamos milagres de Ampère, porque o maior aumento na taxa de transferência por núcleo tensor, a nova arquitetura promete apenas em trabalhar com redes esparsas estruturadas. De fato, substituir um dos mais antigos “Turing” por uma GeForce RTX 3080 não afetará a velocidade de decodificação R3D em resolução de 8K, mas a faixa de 6K e, em particular, 4K no gráfico vai além.

Os aceleradores baseados em chips Ampere, sem dúvida, devem despertar grande interesse não só entre os gamers, mas também entre os profissionais envolvidos no processamento de conteúdo audiovisual. No entanto, salvamos testes mais detalhados das novas placas de vídeo para a GeForce RTX 3090, que é mais profissional do que uma placa de vídeo para jogos.

⇡#Codificação / decodificação de vídeo

Outra inovação nas funções computacionais de silício da Ampere é a decodificação de vídeo AV1 por um NVDEC ASIC dedicado. Talvez este seja o primeiro codec que é tão exigente em recursos de computação que desempacotar o fluxo AV1 em alta resolução, para o qual se destina, com uma taxa de quadros suave vai além das capacidades de um poderoso CPU de oito núcleos, sem mencionar os processadores de notebook. Os chips de ampere resolvem o problema devido à rápida decodificação de hardware, mas ainda não podemos testar esta função por conta própria: na maioria dos codificadores de software, o suporte a AV1 ainda não saiu do estágio experimental e também não permite a criação de clipes com resolução de 8K ou é extremamente lento e demora até vários dias por arquivo.

Nesse ínterim, descobrimos que o NVDEC atualizado aumentou significativamente a velocidade de decodificação dos “antigos” formatos HEVC e VP9, ​​mesmo que já fosse muito alta para assistir a filmes. A GPU precisa de uma reserva para decodificar vários streams em tarefas profissionais, bem como transcodificar rapidamente o vídeo para outro formato usando a CPU ou usando o pacote NVDEC + NVENC. A propósito, o NVENC não sofreu absolutamente nenhuma mudança no Ampere – ainda é o hardware mais rápido H.264 e codificador HEVC encontrado em GPUs e CPUs.

⇡#Desempenho por watt e área de GPU

É prematuro falar sobre as vantagens numéricas dadas à NVIDIA pela transição para a tecnologia de processo de 8 nm até que tenhamos testado a GeForce RTX 3090. O que quer que se diga, o chip GA102 no RTX 3080 foi cortado significativamente, e isso não tem o melhor efeito em sua eficiência energética. No entanto, se você não se concentrar nos processadores, mas em dispositivos específicos, pode fazer alguns cálculos preliminares. Em primeiro lugar, o desempenho por watt da GeForce RTX 3080 ainda aumentou em comparação com o RTX 2080 SUPER baseado no chip TU104 totalmente funcional, e por uma boa quantidade – em 21%. Mas, em comparação com o RTX 2080 Ti – por apenas 9%, embora, repetimos, aqui você precise construir sobre os resultados do RTX 3090.

Bem, e mais importante, em termos de desempenho específico contra o fundo do RTX 3080, não apenas a Radeon VII parece muito pálida, mas também a Radeon RX 5700 XT. O novo produto fornece 40% mais FPS por watt de consumo de energia, embora os chips GA102 e Navi 10 sejam fabricados de acordo com padrões tecnológicos da mesma classe. Claro, não é totalmente correto comparar a eficiência energética de GPUs de escalas tão diferentes. Além disso, sabemos que a Radeon RX 5700 XT foi prejudicada pela voltagem da GPU altamente superestimada. Mas em qualquer caso, é claro que a AMD não pode mais repetir tais erros se pretende superar a lacuna tecnológica de uma geração de GPUs e fazer concorrentes dos chips Navi de segunda geração para NVIDIA Ampere.

⇡#Resultados do teste do jogo e preços recomendados

⇡#Benchmarks de jogos com rastreamento de raio

⇡#Achados

Em um futuro próximo, a GeForce RTX 3080 terá que ser comparada não apenas com os aceleradores NVIDIA da geração anterior, mas também com os próximos produtos de alto desempenho da AMD. No entanto, não importa como esse confronto termine, já está claro que a 30ª série GeForce em chips Ampere é mais provável de causar consenso do que a feroz controvérsia que a linha RTX 20 provocou.

Agora que todas as dificuldades com a entrega de amostras de teste ficaram para trás e podemos operar com os dados de medições de desempenho independentes, os fãs do time verde, que não hesitaram em acreditar nas alegações de superioridade dupla do novo produto sobre o RTX 2080, e os céticos que afirmaram sobre “shaders falsos” terão que desenvolver uma visão de compromisso na velocidade do RTX 3080. Claro, a NVIDIA selecionou testes para materiais de publicidade que representam a nova geração na luz mais favorável, mas na prática a vantagem média do RTX 3080 sobre o GeForce RTX 2080 SUPER é estimada em 55% FPS mais modesto, se você jogar no modo 4K sem traçado de raio e 52–69% com rastreamento (dependendo se DLSS é usado). Pode-se argumentar que pegamos a GeForce RTX 2080 SUPER, e não a RTX 2080 original, que, claro, é mais conveniente para a NVIDIA construir, mas a diferença de desempenho entre as últimas não excede 5% e, portanto, não altera o quadro geral.

O que quer que se diga, em jogos reais o RTX 3080 não é tão forte quanto no papel, mas também não encontramos nenhum motivo para frustração ou schadenfreude nisso. Depois de uma série de chips de Turing – revolucionários em termos de funcionalidade, mas decepcionantes em termos de ganho de desempenho – gostaria de trazer de volta os números da diferença intergeracional de mais de 70% FPS, mas vale lembrar que Pascal foi um fenômeno único que se tornou possível graças ao salto da fotolitografia de 28 para 16 nm. Não é fato que a tecnologia de produção de chips em sua forma moderna permite que ela seja repetida. O Ampere fortaleceu as placas de vídeo NVIDIA mais do que a arquitetura Maxwell, que fazia muito sucesso para a época, e em testes com ray tracing, você pode realmente encontrar resultados próximos às conquistas de Pascal.

Mas o principal em Ampere não é tanto quantitativo quanto qualitativo, que é adquirir crescimento de produtividade. A GeForce RTX 3080 pode lidar com qualquer jogo (exceto o mais complexo ou mal otimizado) a 4K na velocidade máxima e a 1440p não precisa de DLSS na maioria dos casos, mesmo para rastreamento de raios. No entanto, o ray tracing ainda carrega a GPU tão fortemente que, sem tecnologias para escalonar frames de reserva para jogos futuros, ainda mais exigentes, até mesmo o RTX 3080 tem um pouco de sobra (já que o próprio DLSS funciona melhor com cada iteração e não faz sentido tentar descartá-lo a qualquer custo). Seja como for, agora você pode colocar um fim à longa história da GeForce GTX 1080 Ti – os proprietários deste acelerador podem contar com segurança com o dobro da taxa de quadros anterior. A única contra-indicação para atualizar para o RTX 3080 é se você estiver sentado em um monitor com resolução de 1920 × 1080. Mesmo a CPU mais moderna não vai prejudicar o desempenho para o qual foram projetados do Ampere mais antigo em tal modo gráfico.

Talvez a única reclamação que podemos fazer à GeForce RTX 3080 de um ponto de vista puramente técnico seja o consumo de energia, que realmente atinge os 320 watts especificados honestamente. É hora de ressuscitar o antigo meme “GTX – PECH”, senão pela mudança da letra no nome das placas de vídeo. No entanto, também defendemos um ponto de vista positivo e não negativo sobre esta questão. Palit é talvez a marca mais acessível de aceleradores gráficos na Rússia, mas a placa RTX 3080 GamingPro OC, graças à qual conhecemos o Ampere, não tem problemas com resfriamento e silêncio. E por si só, o consumo de energia de usuários bem ventilados (para o RTX 3080 em geral e a placa de vídeo Palit em particular, esta é uma condição fundamental) de PCs desktop não deve se preocupar. É melhor não contar com overclock da GeForce RTX 3080 sozinha – a NVIDIA já fez isso com antecedência.

O que causa preocupações reais é a disponibilidade de novos produtos verdes no varejo e, como resultado, seus preços reais, não os preços de passaporte. Nos últimos anos, ainda não encontramos o fato de que placas de vídeo novas simplesmente não estão à venda em lugar nenhum, embora os parceiros do fabricante de chips tivessem muito tempo para começar a produzir seus próprios dispositivos. E a Founders Edition não está disponível na loja online da NVIDIA russa, mesmo por encomenda. Além disso, já escrevemos na primeira parte da análise do consumidor Ampere que esses aceleradores, em princípio, não são criados baratos. Prepare-se para as primeiras placas GeForce RTX 3080 com preços bem acima dos tentadores valores recomendados. Melhor adiar a atualização por mais um mês ou dois. Então o déficit diminuirá e ficará claro como o competidor vermelho responderá à estreia da 30ª série.

avalanche

Postagens recentes

IBM perdeu a liderança no número de patentes recebidas, mas foi planejado

Em 2022, a International Business Machines (IBM) perdeu a liderança em patentes nos EUA pela…

7 horas atrás

Um insider revelou a data da próxima apresentação do jogo da Microsoft – ele conterá novidades sobre os exclusivos do Xbox e da Bethesda

O editor da publicação Windows Central Jez Corden (Jez Corden), citando suas fontes, compartilhou informações…

10 horas atrás

OBS Studio obtém suporte para codificação AV1 em novas placas gráficas AMD e Intel

Foi lançado o OBS Studio 29.0, um aplicativo popular para gravação de vídeo e organização…

10 horas atrás