Análise da placa de vídeo NVIDIA GeForce RTX 3090: a inveja

É uma pena, jogos com efeitos gráficos de traçado de raio ainda podem ser contados em uma mão.

Talvez os próximos produtos da AMD ainda nos façam ver o Ampere sob uma nova luz, mas até agora o único motivo de insatisfação com as novas placas de vídeo é sua disponibilidade limitada e, como resultado, caro. Mas se de repente o desempenho da GeForce RTX 3080 parecer insuficiente e o dinheiro for uma questão secundária, a NVIDIA deixou uma oferta mais convincente para o final. Vamos descobrir para qual comprador o acelerador gráfico sem precedentes (em termos de potencial computacional e consumo de energia) foi projetado, quando o RTX 3080 já fez todo o trabalho sobre os erros da geração anterior, e para um cinco sólido.

⇡#Especificações GeForce RTX 3080

Dedicamos um artigo separado a uma análise detalhada das GPUs Ampere subjacentes aos novos aceleradores NVIDIA, mas para os leitores que perderam o evento mais significativo da indústria de TI em 2020 e agora estão se familiarizando com a 30ª série GeForce, aqui está um breve Um resumo das principais características da GPU GA102 e dos dois modelos mais antigos da linha RTX 30.

O cristal GA102 contém um número recorde de transistores para chips orientados ao consumidor (28 bilhões) e por este parâmetro é o maior ASIC que é produzido comercialmente hoje, depois do verdadeiro carro-chefe da arquitetura Ampere – GA100 (54 bilhões). No entanto, o GA100 é reservado por aceleradores para data centers e não se destina a jogos. O predecessor direto da novidade, o chip TU102 da família Turing, que é usado na GeForce RTX 2080 Ti e TITAN RTX, contém uma vez e meia menos transistores em comparação com o GA102. No entanto, os chips Ampere ocupam menos espaço em comparação com o Turing e são mais eficientes em termos de energia devido à migração do pipeline de 12nm da TSMC para o processo de 8nm da Samsung.

A matriz GA102 totalmente funcional é estruturada com sete GPCs (Graphics Processing Clusters, os maiores componentes escaláveis ​​do array) em vez de seis no TU102. Cada um deles ainda contém 12 multiprocessadores de streaming, mas uma das principais diferenças arquitetônicas entre Ampere e Turing é que o conjunto de núcleos CUDA de 32 bits que processam números reais foi dobrado dentro do SM. Como resultado, a fórmula da unidade de execução principal GA102 inclui 10.752 núcleos CUDA compatíveis com FP32 e 336 unidades de mapeamento de textura.

No entanto, a GeForce RTX 3080 vem com uma versão significativamente simplificada do GA102, com apenas seis módulos GPC ativos restantes. Além disso, dois deles não estão totalmente equipados com SMs. Como resultado, a GeForce RTX 3980 tem 8.704 ALUs shader para operações FP32 e 272 unidades de mapeamento de textura. Mesmo assim, o GA102 tem um tremendo poder de computação bruto em comparação com os modelos da série 20 principais. A NVIDIA voltou à prática dos anos Kepler e Maxwell, quando aceleradores com números de modelo de -80 ou -80 Ti em RRP 49-699 eram baseados em silício de primeira linha – ao contrário da família Turing – e ofereciam uma relação de desempenho vantajosa em jogos e preços.

Para quem precisa de desempenho máximo para tarefas de trabalho ou simplesmente deseja ter o melhor hardware, a NVIDIA criou a série TITAN, mas desta vez o surgimento de tal placa de vídeo permaneceu em dúvida. O fato é que o carro-chefe da linha principal da GeForce – o RTX 3090 – está perto do limite do chip GA102 em todas as características. Apenas 2 multiprocessadores de streaming são desativados no cristal, que no total contém 256 núcleos CUDA FP32 ou 2% de toda a matriz de ALUs reais. Isso foi feito mais para fornecer uma reserva para possíveis defeitos na fotolitografia, ao invés de segmentação da gama de modelos com a expectativa de produtos futuros. A GeForce RTX 3090 já ultrapassa o TITAN RTX em 2,2 vezes em termos de throughput calculado de operações FP32, e se comparada com a GeForce RTX 2080 Ti, então já 2,5 vezes.

Mas do próximo modelo mais antigo da 30ª série, o novo carro-chefe separa apenas 20% do desempenho teórico. Claro, já sabemos quais números o RTX 3090 pontuou em benchmarks de jogos, mas os leitores familiarizados com a análise do RTX 3080 também não devem esperar ver outros 20% FPS nos gráficos. Não é à toa que a NVIDIA evita comparações diretas entre a GeForce RTX 3080 e a RTX 3090 nas apresentações da série 30. Há apenas um diagrama com dados de três jogos (Control, Minecraft com ray tracing e Borderlands 3), em que o RTX 3090 possui 50% mais FPS em comparação ao TITAN RTX, mas isso também deve ser visto com ceticismo, pois nenhum dos projetos listados acima benchmark integrado e condições de teste podem afetar significativamente o resultado.

Como uma carga, adequada aos recursos da GeForce RTX 3090, a NVIDIA vê os jogos em uma tela de 8K. Considerando que há sete anos as placas de vídeo não suportam 4K (a cada salto de desempenho são lançados projetos que voltam a baixar a taxa de quadros abaixo de 60 FPS nas velocidades máximas), não é fácil acreditar que o RTX 3090 se submeterá imediatamente ao modo 8K. Afinal, o número de pixels em tal monitor ou TV não é duas vezes, mas quatro vezes mais do que 4K, então a NVIDIA se concentra em jogos relativamente leves (como Apex Legends, Forza Horizon 4 e World of Tanks), que são uma tarefa viável para RTX 3090 a 8K em configurações gráficas altas. Para projetos mais exigentes, incluindo aqueles com traçado de raio, um modo de operação DLSS especial foi introduzido, o que implica em dimensionar um quadro renderizado em 2560 × 1440 para um tamanho total de 7580 × 4320 pixels, e o número de pixels nesta proporção entre a resolução interna e de saída difere 8,8 vezes. Claro, as implementações modernas de DLSS versão 2.0 têm um desempenho muito melhor do que as tentativas anteriores e sintetizam uma imagem de alta qualidade em 4K que apenasum exame mais detalhado dos fragmentos de quadro pode revelar erros de rede neural, mas algoritmos ainda mais agressivos necessários para 8K são certamente um novo desafio para DLSS. Quando tivermos a oportunidade de testar a GeForce RTX 3090 em conjunto com uma tela real de 8K, definitivamente descobriremos se as afirmações da NVIDIA correspondem à realidade, mas hoje nos limitaremos ao conjunto padrão de testes em resoluções de 1080p a 2160p.

Em qualquer caso, o RTX 3090 não é apenas para jogos, mas para aplicações de trabalho. Em tarefas como modelagem 3D, codificação de vídeo e, claro, aprendizado de máquina, é bem possível contar com um aumento de desempenho próximo aos valores de design entre TITAN RTX e GeForce RTX 3090 (especialmente em função das inovações arquitetônicas do Ampere) ou mesmo entre RTX 3080 e RTX 3090. Mas a principal vantagem do RTX 3090 sobre o RTX 3080 são os 24 GB de RAM. Além disso, todos os controladores GDDR6X foram ativados nele, e a largura de banda da memória agregada é estimada em 960 GB / s para obter esse volume e fornecer acesso rápido aos dados no cristal GA102 quase intocado. Apenas o Radeon VII (1 TB / s) equipado com memória HBM2 apresenta uma interface VRAM mais rápida entre aceleradores de jogos e de prosumer.

Finalmente, a GeForce RTX 3090 foi a única placa de vídeo da 30ª família que suporta NVLink para comunicação direta entre duas GPUs. A largura de banda total do canal permaneceu quase a mesma dos aceleradores de consumidor da arquitetura de Turing (112,5 GB / s versus 100 GB / s em ambas as direções), mas esta é uma versão diferente da interface, que agora consiste em quatro linhas com uma velocidade de 28,13 GB / s em vez dos dois anteriores a 50 GB / s, e requer o uso de novas pontes. A função NVLink no RTX 3090 também não foi deixada para jogos, mas para aplicativos GP-GPU que são capazes de usá-la, mas o tamanho do cluster é, em qualquer caso, limitado a duas GPUs. O suporte para a tecnologia SLI não foi a lugar nenhum, mas a partir do próximo ano a NVIDIA não lançará perfis para novos jogos. Trabalhar com várias GPUs foi deixado à mercê dos desenvolvedores, que terão que implementar a função mGPU por conta própria no modo Direct3D 12 explícito.

A última característica da GeForce RTX 3090 que devemos prestar atenção antes de olharmos para o exemplar de teste da placa de vídeo é o consumo de energia. De acordo com o fabricante do chip, o desempenho dos chips Ampere por watt de potência em casos favoráveis ​​aumentou em 90% em comparação com Turing. No entanto, em nosso próprio estudo, a GeForce RTX 3080 é apenas 8% mais eficiente em energia do que a GeForce RTX 2080 Ti e 21% melhor do que a RTX 2080 SUPER no que diz respeito à carga de jogos. O modelo principal deve superar esses resultados devido ao fato de usar uma versão quase totalmente ativada do GA102. E, no entanto, a RTX 3090 é uma placa de vídeo que consome muita energia, classificada para consumo de energia de até 350 W contra 320 W para a RTX 3080.

Por fim, vale a pena comentar mais uma vez sobre os preços recomendados para aceleradores da 30ª série. O acelerador campeão recebeu um preço sem precedentes alto para placas de vídeo de consumo (pelo menos um chip) de 499. No entanto, essa novidade também representa uma oferta melhor em comparação com sua contraparte direta da geração anterior, TITAN RTX, que já custava 499. É possível que a fabricante de chips volte aos preços anteriores se lançar um TITAN real baseado no GA102, mas o surgimento de tal placa de vídeo é questionável devido ao fato de que a NVIDIA ainda não pode oferecer aos profissionais que são alvos de “Titãs” vantagens tangíveis sobre aquelas características que tem uma GeForce RTX 3090. A própria GPU está funcionando quase em sua velocidade potencial e será possível aumentar a quantidade de RAM para 48 GB somente quando a Micron iniciar a produção de chips GDDR6X de 16 gigabit. De acordo com rumores, tais placas de vídeo definitivamente aparecerão, apenas com memória GDDR6 regular e dentro da série Quadro, para a qual o volume e a função de correção de erros são mais importantes do queaumento da largura de banda GDDR6X.

Enquanto os aceleradores TITAN são produzidos por encomenda da NVIDIA exclusivamente em um design de referência, os parceiros da fabricante de chips receberam autorização para desenvolver suas próprias versões da GeForce RTX 3090 junto com os modelos mais jovens da 30ª família. Um desses dispositivos, o Palit GeForce RTX 3090 GamingPro OC, apresentará as soluções atuais carro-chefe da NVIDIA para jogos e prosumer em testes de desempenho. Assim como a GeForce RTX 3080 do mesmo fabricante, esta placa de vídeo vem com pré-overclock, mas não há necessidade de se preocupar com o fato de que o overclock de fábrica dará à RTX 3090 uma vantagem injusta sobre as gerações anteriores de placas de vídeo. Ambos os dispositivos Palit – o RTX 3080 e o RTX 3090 – têm overclock de apenas 30 MHz na frequência de clock calculada em uma carga típica (Boost Clock) e, mais importante para o desempenho dos aceleradores modernos, operam dentro da reserva de energia nominal de 320 e 350 W, respectivamente. …

⇡#Palit GeForce RTX 3090 GamingPro OC: construção, conjunto de entrega

Em termos de design do cooler e uma série de características principais, a versão da GeForce RTX 3090 apresentada pela Palit sob a marca GamingPro é uma cópia do RTX 3080, que analisamos na semana passada. Ao contrário da NVIDIA, que forneceu diferentes sistemas de resfriamento em dispositivos Founders Edition – um para o RTX 3080 e outro, mais poderoso, para o RTX 3090 – a maioria dos fabricantes independentes de placas de vídeo fabricam placas de vídeo usando o mesmo modelo.

Não foi à toa que a Palit instalou um sistema de refrigeração tão poderoso no chip GA102. A placa de vídeo ocupa três slots de expansão de gabinete e para evitar que a borda livre da placa de circuito impresso afunde com o peso do radiador, você precisa usar o suporte de acrílico que vem com as séries RTX 3080 e RTX 3090 GamingPro OC.

Não vamos entediar os leitores com uma descrição excessivamente detalhada do design e sistema de refrigeração da placa de vídeo, quando estudamos quase o mesmo dispositivo na semana passada, mas iremos listar brevemente seus principais recursos. A Palit é conhecida dos compradores russos por preços acessíveis, muitas vezes são as suas placas de vídeo que ocupam a linha de fundo das tabelas de preços de um determinado modelo, mas ao mesmo tempo, já vimos mais de uma vez que esta empresa pode economizar nas funções secundárias dos dispositivos, sem descurar a qualidade dos componentes mais importantes , e melhora seus produtos com cada geração de GPUs.

Os aceleradores baseados em chips GA102 exigem responsabilidade especial, porque desta vez a NVIDIA não hesitou em aumentar o consumo de energia para 350 W, e a migração para um novo tipo de memória GDDR6X acarreta certas dificuldades. Não é surpreendente que Palit tenha dado mais um passo em frente no design do sistema de refrigeração, as vantagens do qual não se limitam a um grande radiador, que é soprado por três ventoinhas de 95 mm.

Os chips GDDR6X precisam ser soldados o mais próximo possível do substrato da GPU devido aos maiores requisitos de relação sinal-ruído da interface. Como resultado, as placas de vídeo podem ser montadas em placas de circuito impresso mais curtas e o espaço livre pode ser usado para a expansão do radiador – isso é feito na Founders Edition e no Palit GamingPro.

Fora isso, temos diante de nós um radiador de duas seções bastante típico, talvez muito grande, mesmo para os padrões da geração anterior, perfurado por vários tubos de calor em forma de U. Ao contrário da Founders Edition, ele não usa uma câmara de vapor cara e uma base de cobre niquelado remove o calor da GPU. Os chips de memória e os estágios de potência do regulador de tensão são cobertos por uma enorme moldura de alumínio, acoplada ao radiador principal, e as bobinas VRM ficam diretamente com as aletas deste último através de espaçadores térmicos.

Devido ao fato dos chips de RAM da GeForce RTX 3090 serem soldados em ambos os lados da placa de circuito impresso, a tampa traseira é instalada não apenas para beleza e proteção dos componentes, mas também para resfriar a VRAM.

O novo cooler para placas de vídeo Palit com um radiador totalmente expandido se provou bem nos testes da GeForce RTX 3080: ele fornece simultaneamente uma temperatura moderada de GPU e baixo nível de ruído. No entanto, o RTX 3090 em seu pico de consumo de energia não é mais 320, mas 350 watts. Vamos ver quais resultados nos esperam desta vez. Em qualquer caso, alertamos os potenciais proprietários da GeForce RTX 3080 e especialmente do RTX 3090 que o gabinete do computador no qual tal placa de vídeo se instalará deve ter ventilação de qualidade extremamente alta. O ar que passa pelo radiador da GPU entra na área do processador central, mas o Palit GamingPro não tem os meios para extrair o calor para fora: todas as aletas do radiador correm paralelas à placa de montagem da placa de vídeo e os slots nela são puramente decorativos.

⇡#Palit GeForce RTX 3090 GamingPro OC: PCB

A julgar pelo layout das placas de circuito impresso GeForce RTX 3080, fotos das quais apareceram na Internet após o lançamento da 30ª série, muitos fabricantes, incluindo Palit, tomaram o design de referência como base para o PCB (não deve ser confundido com os cartões da Founders Edition, que se destacam da massa da massa ainda mais Série 20), que a NVIDIA distribuiu entre os parceiros para lançar rapidamente a produção de aceleradores de nova geração.

A versão Palit da GeForce RTX 3090 é a mesma coisa, ajustada apenas para o aumento do número de chips de RAM, que são soldados em ambos os lados da placa de circuito impresso e funcionam no modo concha. A propósito, a Micron não produz chips GDDR6X com uma largura de banda nominal de 19,5 Gbit / s. Todas as versões do RTX 3090 vêm com memória de 21 Gbps, mas a largura de banda real foi reduzida para 19,5 no interesse da estabilidade, o que é um bom começo para overclock.

Além de 24 GB de RAM, a PCB Palit GeForce RTX 3090 GamingPro OC é diferente da PCB do próximo modelo mais antigo do mesmo fabricante com reguladores de tensão aprimorados. O layout PCB tornou possível organizar a fonte de alimentação de 16 fases da GPU usando dois controladores On Semiconductor NCP81610 de oito fases, cada um servindo sua própria parte do cristal GA102. A memória GDDR6X é alocada em quatro fases, mas os componentes de uma fase da fonte de alimentação VRAM são os únicos com os quais a Palit encontrou uma maneira de economizar dinheiro. As fases de alimentação da GPU são alimentadas por estágios de alimentação AOZ5311NQI da Alpha e Omega com uma corrente nominal de 50 A.

⇡#Suporte de teste, metodologia de teste

Na maioria dos jogos de teste, as taxas de quadros média e mínima são derivadas de uma série de tempos de renderização de quadros individuais, que são registrados pelo benchmark integrado (ou pelo utilitário OCAT, se não estiver disponível).

A taxa média de quadros nos gráficos é o recíproco do tempo médio de quadros. Para estimar a taxa de quadros mínima, o número de quadros formados a cada segundo do teste é calculado. Desta matriz de números, seleciona-se o valor correspondente ao 1º percentil da distribuição. Red Dead Redemption 2 é uma exceção: seu benchmark integrado registra o primeiro percentil do tempo de renderização do quadro, do qual a taxa de quadros correspondente é derivada.

A potência das placas de vídeo é registrada separadamente da CPU e de outros componentes do PC usando um wattímetro JUNTEK VAT-1050 ou um dispositivo NVIDIA PCAT semelhante. Como uma carga de teste para testes de potência e ruído, o Crysis 3 é usado em uma resolução de 3840 × 2160 sem anti-aliasing de tela cheia e com configurações máximas de qualidade gráfica, bem como o teste de estresse FurMark com as configurações mais agressivas (resolução 3840 × 2160, MSAA 8x). Todos os parâmetros são medidos após o aquecimento da placa de vídeo, quando a temperatura da GPU e a velocidade do clock se estabilizam.

⇡#Participantes do teste

As seguintes placas de vídeo participaram do teste de desempenho:

  • Palit GeForce RTX 3090 GamingPro OC (1395/1725 MHz, 19,5 Gb / s, 24 GB);
  • Palit GeForce RTX 3080 GamingPro OC (1440/1740 MHz, 19 Gb / s, 10 GB);
  • NVIDIA GeForce RTX 2080 Ti FE (1350/1645 MHz, 14 Gb / s, 11 GB);
  • NVIDIA GeForce RTX 2080 SUPER FE (1650/1815 MHz, 15,5 Gb / s, 8 GB);
  • NVIDIA GeForce GTX 1080 Ti FE (1480/1582 MHz, 11 Gb / s, 11 GB);
  • NVIDIA GeForce GTX 1080 FE (1607/1733 MHz, 10 Gb / s, 8 GB);
  • AMD Radeon RX 5700 XT (1605/1905 MHz, 14 Gb / s, 8 GB);
  • AMD Radeon VII (1400/1750 MHz, 2 Gbps, 16 GB).

Aproximadamente. As frequências base e boost de acordo com as especificações de cada dispositivo são indicadas entre colchetes após os nomes das placas de vídeo. Placas de vídeo de design não referencial são trazidas de acordo com os parâmetros de referência (ou próximos a estes), desde que isso possa ser feito sem edição manual da curva de freqüência do clock. Caso contrário (aceleradores NVIDIA GeForce série 16, bem como GeForce RTX 2070/2080/2080 Ti Founders Edition), as configurações do fabricante são usadas.

⇡#Velocidades de clock, consumo de energia, temperatura, ruído e overclocking

Ambas as novas placas de vídeo baseadas em chips NVIDIA – ambas GeForce RTX 3080 e RTX 3090 – são apresentadas em nossos testes por dispositivos Palit, elas são servidas pelo mesmo sistema de refrigeração, ambas estão ligeiramente (apenas para exibição) com overclock de 30 MHz na frequência Boost Clock, mas funcionam dentro da referência TDP: 320 e 350 W respectivamente. Estas são as condições ideais para comparar as velocidades de clock reais sob carga e dissipação de calor do RTX 3080 e RTX 3090, já que a maioria dos parceiros NVIDIA optou pelo design unificado dos modelos mais antigos e mais jovens em vez de fortalecer ainda mais o sistema de resfriamento RTX 3090, como é feito nos dispositivos da Founders Edition.

Como a prática tem mostrado, de acordo com os parâmetros listados, o RTX 3090 não difere muito do RTX 3080. Sim, o consumo de energia do carro-chefe é 24-28 W maior, mas quase não prejudica as frequências de clock da GPU: a propagação da frequência de clock estável em jogos entre as duas variedades GA102 é cerca de 38 MHz, e 1950 MHz é o limite de overclock automático universal nas configurações padrão. Mas o cooler, talvez, devesse ser substituído por algo mais sério. Isso não quer dizer que a Palit GeForce RTX 3090 GamingPro OC superaquece ou funciona muito alto, mas ainda assim, em termos de nível de ruído, a placa de vídeo não está longe da versão turbina da GeForce GTX 1080 Ti, e esta, como você sabe, não é uma comparação muito lisonjeira. O RTX 3080 do mesmo fabricante é muito mais silencioso.

Aproximadamente. Todos os parâmetros são medidos após o aquecimento da GPU e a estabilização das frequências do clock.

Em termos de overclock, contamos com a GeForce RTX 3090 ainda menos do que com o RTX 3080, mas descobrimos que o modelo carro-chefe fez overclock um pouco melhor. Novamente, não fomos capazes de aumentar a frequência de clock da GPU alvo em mais de 50 MHz, mas devido ao fato de que a reserva de energia do dispositivo pode ser deslocada não em 4, mas já em 9%, o aumento real na frequência de clock estável sob carga atingiu 85 MHz contra 49 MHz e RTX 3080. Além disso, a RAM GDDR6X não foi tão meticulosa dessa vez. O GeForce RTX 3090 é equipado com chips que supostamente funcionam a uma velocidade de 21 Gb / s, portanto, um overclock forte do padrão de 19,5 Gb / s para o RTX 3090 a 21,8 Gb / s não causa perda de estabilidade ou misteriosas quedas de desempenho. Pense bem, agora a largura de banda total da memória da placa de vídeo é de 1046 GB / s – até mais do que a Radeon VII com chips HBM2.

E ainda, fazer overclock da GeForce RTX 3090 é mais um interesse acadêmico do que prático. Pelo menos quando se trata do acelerador Palit GamingPro OC. Além disso, o preço da largura de banda de memória adicional e frequência de clock do núcleo de 85 MHz foi um aumento no consumo de energia em mais 14-21 W – até os assustadores 358-356 W. Felizmente, a GPU ainda evita superaquecimento, e você só pode sentir a diferença no nível de ruído do sistema de refrigeração sob estresse.

⇡#Testes de jogos (1920 × 1080)

Como descobrimos em nossa análise da GeForce RTX 3080, há poucos benefícios com essas poderosas placas de vídeo com resolução de 1080p. A menos que você carregue a GPU com traçado de raio (cobriremos este problema separadamente), mas embora esses jogos possam ser contados em um lado, comprar uma GeForce RTX 3090 para jogar em um monitor Full-HD parece ridículo. Claro, o novo carro-chefe, mesmo em condições desfavoráveis ​​para si mesmo, demonstrou um sério aumento de desempenho entre gerações: ultrapassou a GeForce RTX 2080 Ti e o TITAN RTX em 33 e 24% da taxa de quadros média, fornece 81% mais FPS em comparação com a popular GeForce GTX 1080 Ti e 76% a mais em comparação com o produtor Radeon VII.

E, no entanto, não são esses os números com que o comprador do modelo mais caro da nova onda tem o direito de contar, até porque a diferença entre o RTX 3080 e o RTX 3090 oscila em torno de 9% de frames por segundo. Se considerarmos a GeForce RTX 3090 como um acelerador de jogos, e não um acelerador profissional (o que em si não é totalmente justo), você precisa se concentrar em jogos com traçado de raios ou em uma resolução de tela superior. O bloco de resultados de teste em 1080p é uma ilustração dessa regra, ao invés de uma reprovação ao RTX 3090, mas ainda é uma pena que em nossa época, quando existem monitores com uma taxa de atualização de até 360 Hz, uma combinação da GPU e do processador central acabou sendo um gargalo do sistema, impedindo a velocidade de reação no modo gráfico, que é mais propício para altas taxas de quadros.

⇡#Testes de jogo (2560 × 1440)

Anteriormente, quando os jogos eram dominados por métodos de anti-aliasing de tela cheia MSAA e SSAA com uso intensivo de recursos, os benchmarks a 1440p causavam uma carga de GPU equivalente aos benchmarks em uma tela de 4K, mas sem anti-aliasing. Agora que quase todos os novos jogos dependem de algoritmos de anti-aliasing temporais rápidos, em muitos casos as taxas de quadros em 1080p e 1440p em placas gráficas potentes diferem ligeiramente. A vantagem da GeForce RTX 3090 sobre os modelos “verdes” de última geração da geração anterior aumentou para 41% da taxa de quadros média, se tomarmos a GeForce RTX 2080 Ti como ponto de partida e 29% no caso do TITAN RTX, mas o carro-chefe não aumenta significativamente o FPS em comparação com a GeForce RTX 3080 trouxe, se não contando que 10% da taxa de quadros média.

Mas quando você altera a resolução de 1080p para 1440p, a distância entre o RTX 3090 e aceleradores mais fracos aumenta. Agora a GeForce RTX 3090 é quase duas vezes mais rápida que a GeForce GTX 1080 Ti e a Radeon RX 5700 XT, e a GeForce GTX 1080 sem o prefixo Ti é 2,5 vezes mais rápida. No entanto, benchmarks em 1440p ainda não são o ambiente certo para testar um dispositivo que promete puxar jogos modernos em uma tela de 8K. Ainda temos que descobrir se a GeForce RTX 3090 faz jus a essas alegações de alto perfil, uma vez que tenhamos um monitor ou TV com as configurações corretas.

Além disso, mesmo 4K não pode ser considerado um estágio ultrapassado. Não há uma única placa de vídeo em nosso banco de dados de resultados de teste que garanta sólidos 60 FPS em todos os jogos modernos com configurações de detalhes máximos em uma resolução de 2160p. Talvez fosse a GeForce RTX 3090 que faltava para consertar essa falha?

⇡#Testes de jogos (3840 × 2160)

Em testes com resolução de 4K, a lacuna entre a GeForce RTX 2080 e a RTX 2090 torna-se a maior. Claro, existem jogos teimosos como Assassin’s Creed Odyssey que ainda não conseguem extrair mais de 2% de FPS extra do dado GA102 quase intocado na placa RTX 2090. No entanto, ACO é o único jogo no conjunto de benchmarks que se apega à desatualizada API Direct3D 11. Em títulos modernos, a diferença entre GeForce RTX 3080 e RTX 3090 é de 9-14% (12% em média) taxas de quadros. Mais dificilmente pode ser esperado sob a carga de jogos, e apenas em aplicativos profissionais selecionados, talvez ainda veremos números próximos a 20%, que estimam a taxa de transferência do RTX 3090 em operações FP32 sobre o RTX 3080.

No entanto, era 9-14% FPS que faltava à GeForce RTX 3080 para quebrar a barra de 60 FPS em jogos extremamente exigentes como Control, Metro Exodus e Red Dead Redemption 2. 60 FPS ainda não é dado ao hardware moderno no Total War: TRÊS REINOS, mas neste caso temos mais dúvidas sobre a otimização do motor gráfico, que é usado nas estratégias desta série.

Em 4K, a vantagem do RTX 3090 sobre os modelos NVIDIA ex-top atingiu proporções verdadeiramente impressionantes. O novo carro-chefe poderia substituir três GeForce GTX 1080s de uma vez, desde que funcionassem efetivamente no modo SLI triplo, e a GeForce GTX 1080 Ti o dobrasse, e outros 16% FPS em cima disso. O mesmo se aplica às ofertas mais poderosas da AMD antes do lançamento da série Radeon 6000: a GeForce RTX 3090 está 123% FPS à frente da Radeon RX 5700 XT e oferece uma taxa de desempenho mais suave em comparação com a Radeon VII, que, como você sabe, funciona em resolução 4K de forma mais eficiente.

A GeForce RTX 3090 parece muito sólida mesmo contra o fundo dos aceleradores mais poderosos da família GeForce RTX 20: é 1,5 vez mais rápida que a GeForce RTX 2080 Ti e fornece 37% mais FPS em comparação com o TITAN RTX.

⇡#Testes de jogos com overclock

Como esperávamos, com um modesto GPU com overclock para 85 MHz, uma frequência de clock estável sob carga de jogos não pode ser um aumento praticamente significativo no desempenho em jogos. Não é verdade que um papel mais significativo em experimentos com a GeForce RTX 3090 não seja desempenhado pelo GDDR6X RAM, recrutado com chips com largura de banda nominal de 21 Gb / s por contato, que é muito fácil de recuperar, a partir dos subestimados 19,5 Gb / se até ultrapassar No total, o Palit GeForce RTX 3080 GamingPro OC tem melhor overclock do que o RTX 3080 da mesma marca, mas mesmo no modo 4K, que é mais sensível ao desempenho da placa de vídeo, o aumento médio da taxa de quadros é reduzido para 4% FPS.

Testes de jogos com rastreamento de raio. Cálculos para fins gerais. Codificação / decodificação de vídeo. Tabelas de resultados. conclusões

⇡#Testes de jogos Ray-tracing

O rastreamento de raio, especialmente em resoluções de 1440p e 4K, ajudou a GeForce RTX 3080 a se distanciar mais do antigo Turing em termos de taxas de quadros em jogos. Se pegarmos as placas de vídeo topo de linha baseadas no chip TU102, GeForce RTX 2080 Ti e TITAN RTX como ponto de partida, a vantagem da nova arquitetura não foi a lugar nenhum e aumentou de forma previsível. A GeForce RTX 3090 oferece crescimento de taxa de quadros de 38% a 53% sobre a GeForce RTX 2080 Ti e de 29% a 40% sobre o TITAN RTX.

O RTX 3090 nem precisa de DLSS para obter a taxa de quadros média acima de 60 FPS em uma tela de 1440p em jogos como Metro Exodus, e Minecraft totalmente rastreado e Quake II RTX a 1440p apenas voe nele. Talvez, se houvesse mais jogos com suporte a ray tracing do que no momento, poderíamos dizer que a GeForce RTX 3080 e RTX 3090 são uma compra completamente racional não apenas para proprietários de monitores 1440p e 4K, mas também para a maioria dos jogadores sentado atrás de telas Full HD.

No modo 2160p, havia apenas um jogo no qual a GeForce RTX 3090 produzia mais de 60 FPS sem escala DLSS – Battlefield V – e em Shadow of the Tomb Raider faltava 6 quadros por segundo até o ponto crítico. Em outros projetos com traçado de raio, ambas as novas placas de vídeo ultrapassaram o limite de 30 FPS, o que é uma conquista importante por si só, mas em geral os jogos com traçado de raio em 4K e sem DLSS ainda não são um cenário totalmente funcional, mesmo para GPUs desta classe, como GA102. Por sua vez, com DLSS, o novo carro-chefe ainda é significativamente, mas não muito mais rápido que seus antecessores em termos de velocidade: é 43% mais rápido que a GeForce RTX 2080 Ti e 30% FPS à frente do TITAN RTX.

Nessas condições, há uma luta pela diferença nas unidades FPS, que continua inabalável mesmo no topo da própria 30ª família. No rastreamento de raios de jogos, a GeForce RTX 3090 é talvez apenas 11% melhor que a RTX 3080 (e este é o resultado mais favorável), mas outra placa de vídeo que fará, por exemplo, Control incondicionalmente jogável em 4K na velocidade máxima (embora com DLSS, que funciona muito bem neste jogo) até simplesmente não existir.

⇡#Computação de uso geral

Embora a GeForce RTX 3090 seja formalmente separada de outros modelos da série 30 apenas por um preço alto, em termos de quantidade de RAM e, para ser honesto, pelo aumento modesto no FSP de jogos, pode-se entender que este dispositivo se destina mais ao trabalho em aplicações profissionais do que ao entretenimento. Até que os dispositivos Quadro baseados em GA102 supostamente tenham 48 GB de RAM, simplesmente não havia placa gráfica com recursos mais avançados para estações de trabalho.

A primeira aplicação para a GeForce RTX 3090, onde 20% extra de poder de processamento FP32 pode ser crítico mesmo sem o dobro da VRAM da GeForce RTX 3080, é a edição de vídeo e codificação de vídeo de alta definição. A reprodução ao vivo de vídeos carregados de efeitos complexos no Adobe Premiere Pro ainda é impossível em resolução 4K completa a 60 FPS, mas o RTX 3090 já está perto de 50, enquanto o GeForce RTX 2080 Ti e o TITAN RTX são limitados a 41– 42 FPS. Mas a principal vantagem do chip GA102 quase totalmente funcional é a aceleração da codificação. Enquanto a GeForce RTX 3080 não foi melhor que o TITAN RTX nesta tarefa, o RTX 3090 conseguiu aumentar a velocidade de renderização em ProRes em 19%. Outra descoberta, um tanto inesperada, é que a ativação do codificador NVENC dedicado para exportação H.264 não trouxe nenhum benefício para todas as placas NVIDIA participantes, com exceção do RTX 3090. Parece que em outros casos o desempenho simplesmente depende do array de sombreadores GPU. e núcleos RTX 3090 CUDA opcionais eliminam o gargalo e permitemProblema 19% mais rápido do que sem NVENC. Note que estamos falando de testes com efeitos pesados, projetados para carga máxima da GPU. Em outras condições, a codificação no NVENC pode acelerar a renderização ainda mais – é claro, desde que o usuário esteja disposto a comprometer a qualidade da imagem, já que o método do software ainda está fora de competição aqui.

A GeForce RTX 3090 causou uma impressão ainda mais forte nas tarefas de rastreamento de raios offline. O Cycles Tile Renderer Benchmark classificou o desempenho do RTX 3090 como 25% mais rápido do que o RTX 3080 e mais do que dobra a velocidade de renderização em comparação com o TITAN RTX, independentemente de estar usando rastreamento de raio de software completo para a API CUDA ou núcleos RT de hardware para OptX.

No benchmark sobre o motor ProRender, o novo carro-chefe não teve um desempenho tão brilhante, mas um aumento tangível no desempenho ainda está ocorrendo: GeForce RTX 3090 está 15% à frente do RTX 3080 e 40% à frente do TITAN RTX.

Aproximadamente. Para testar novas placas de vídeo, mudamos para a versão atual do Blender – 2.9 – e descobrimos que a Radeon RX 5700 XT novamente perdeu a capacidade de funcionar com o motor Cycles.

Finalmente, as bibliotecas REDCINEX-PRO projetadas para decodificação de hardware e eliminação de camadas de arquivos RED R3D usando núcleos tensores de chips NVIDIA não são mais particularmente sensíveis à diferença entre GeForce RTX 3080 e RTX 3090. Felizmente, qualquer uma das duas placas de vídeo mais do que duplica a velocidade de processamento gravações em resolução 4K e em 6K GeForce RTX 3090 é 25% mais rápido em comparação com o TITAN RTX.

⇡#Codificação / decodificação de vídeo

Em nossos benchmarks GeForce RTX 3080 lançados na semana passada, contornamos um dos novos recursos de silício da Ampere – decodificação de hardware do fluxo de vídeo AV1. O fato é que os codificadores de software livre do novo padrão AV1, que tentamos utilizar, ainda não saíram do estado experimental e estão funcionando tão lentamente que a criação de um arquivo de teste com resolução de 8K (que, na verdade, requer alta compressão, possível dentro AV1) teria demorado tanto que o material para o benchmark não teria tido tempo de revisar o RTX 3090. Isso acontece precisamente na codificação em 8K, e não é uma questão de desempenho do CPU. Felizmente, encontramos uma gravação AV1 na rede com aproximadamente a mesma taxa de bits dos clipes de teste de 8K em HEVC e VP9, ​​e podemos comparar com segurança a velocidade de processamento de diferentes formatos usando o módulo NVDEC atualizado.

O codec AV1 é projetado principalmente para streaming de alta definição e vídeo HDR pela rede e tem como objetivo substituir o VP9 nesta função. No entanto, o preço de uma alta taxa de compressão com uma alta qualidade de imagem ao mesmo tempo é a potência de processamento necessária para decodificar o fluxo. O vídeo AV1 a 8K a 30 FPS carrega a CPU de oito núcleos da bancada de teste (Intel Core i9-9900K, executando a uma frequência constante de 4,8 GHz usando instruções AVX) 50% quando o arquivo é reproduzido a partir do armazenamento local e 60% por meio do navegador … Claro, a maioria dos usuários simplesmente não tem nada para assistir a vídeos 8K, mas, por outro lado, nem todo mundo tem esses computadores.

Como os testes mostraram, o decodificador de hardware NVDEC em chips Ampere processa AV1 ainda mais rápido do que outros métodos de compactação e atinge 110 quadros por segundo em resolução de 8K sem HDR. Além disso, a nova versão do NVDEC lida com o fluxo HEVC e VP9 de forma ainda mais eficiente do que o ASIC embutido nos processadores de Turing. Não temos dúvidas de que a capacidade de decodificar AV1 será adquirida por todos os futuros produtos da série 30 baseados em chips Ampere juniores, que eventualmente encontrarão aplicação não apenas em placas de vídeo discretas para PCs, mas também em dispositivos móveis.

Quanto ao codificador de hardware H.264 e HEVC, o GA102 usa a mesma versão NVENC do Turing, mas não há necessidade de reclamar de seu desempenho – no modo rápido você pode codificar pelo menos 8K a 60 FPS em tempo real.

⇡#Desempenho por watt e área de GPU

Agora que podemos operar com os resultados do teste da GeForce RTX 3090, que usa um processador gráfico com perdas mínimas de unidades de computação ativas e um barramento de memória completo de 384 bits, vamos voltar à avaliação de eficiência energética do chip GA102. Uma imagem bastante curiosa se abriu diante de nós. Nenhum outro produto baseado em Turing dá ao RTX 3090 números como a diferença de 90 por cento no desempenho por watt de que falam as apresentações da NVIDIA. Com base na GeForce RTX 2080 SUPER em um chip TU104 totalmente ativo, estamos falando de um aumento de 25% na eficiência energética. No entanto, quanto menos unidades computacionais dentro do chip que têm um impacto direto no desempenho (streaming de multiprocessadores e ALUs shader), maior a contribuição para o consumo de energia das partes da GPU que não escalam tão bem.

Vale a pena mudar para a GeForce RTX 2080 Ti e TITAN RTX, e a vantagem da GeForce RTX 3090 em eficiência de energia cai para 13 e 7%, respectivamente. Além disso, descobrimos que o RTX 3090 fica 10% menor em termos de velocidade de jogo específica por contagem de transistor em favor do TITAN RTX. Em teoria, um cristal GA102 totalmente funcional poderia fornecer números ligeiramente diferentes, mas no RTX 3090 o chip perdeu apenas 2% de seu poder de processamento potencial. Também não podemos nos referir a jogos com traçado de raio, porque em uma resolução de 4K, a relação de desempenho entre os dispositivos em consideração depende fracamente deste fator.

Aproximadamente. Jogos com resolução de 3840×2160 sem traçado de raio e DLSS.

A classificação de eficiência energética quase dobrada não parece adequada, mesmo quando comparada a GA102 à GPU carro-chefe que a NVIDIA usou nas placas de vídeo do consumidor série GeForce 10: a RTX 3090 fornece apenas 38% mais FPS por watt do que a GeForce GTX 1080 Ti, embora os chips façam a transição do pipeline de 16 nm O Samsung 8nm da TSMC representa uma etapa completa do padrão de fabricação. O que quer que se diga, o Ampere (pelo menos em sua versão de consumidor baseada na tecnologia de processo 8N) conquistou novos patamares de desempenho principalmente devido a mudanças na microarquitetura e simples expansão das unidades de computação, que a fotolitografia avançada permitia, ao invés do aumento da eficiência energética. No entanto, ainda estamos longe de colocar um fim nesta questão: se nos concentrarmos especificamente no desempenho por watt, é melhor pegar a futura GeForce RTX 3070 para comparação, que é a mais próxima dos produtos baseados no TU102 em termos de número de transistores de GPU e consumo de energia.

Além disso, a NVIDIA ainda está em uma posição vantajosa em comparação com os produtos do concorrente: o chip Navi 10 não alcançou nem mesmo Turing em eficiência de energia, e a GeForce RTX 3090 está à frente da Radeon RX 5700 XT em 45% da velocidade específica. A correção deve ser feita novamente para a escala diferente dos processadores sendo comparados, mas a AMD claramente tem que fazer algum trabalho nos erros a fim de reduzir ou, idealmente, eliminar o atraso tecnológico de seu silício.

⇡#Resultados do teste do jogo e preços recomendados

⇡#Benchmarks de jogos com rastreamento de raio

⇡#Achados

Você pode se indignar o quanto quiser com o custo da GeForce RTX 3090, mas a dor diminuirá se você colocar o campeão do dispositivo NVIDIA em um contexto histórico. Na realidade, a empresa simplesmente voltou à velha segmentação da linha de placas gráficas de consumo, em que o lugar de destaque para os jogadores foi ocupado por um acelerador baseado em uma GPU de primeira camada correspondentemente reduzida (GK110, GM200, GP102) a preços que variam de $ 649 a $ 699. Ao mesmo tempo, para quem necessitava de maior rendimento ou de vantagens específicas para as tarefas profissionais (como o dobro da RAM), a Santa Clara ofereceu o próximo “Titan”. Só agora ele tem um nome diferente e faz parte formalmente da série de jogos GeForce. No entanto, é possível que a NVIDIA planeje lançar um TITAN completo no futuro – possivelmente com um chip GA102 totalmente funcional e 48 GB de memória GDDR6X a bordo (assim que a Micron iniciar a produção de chips de 16 megabit de um novo tipo).

Mas se considerarmos a GeForce RTX 3090 justamente como a sucessora da marca TITAN, não há dúvida de um retorno total à política de preços anterior, que foi rompida com a geração de placas de vídeo baseadas em chips Turing. Com preço recomendado de 499, o novo produto é muito mais barato que o TITAN RTX, que a NVIDIA lançou por 499, mas as raízes da série TITAN remontam aos dispositivos por 99. E ainda, as indulgências que seguem os modelos mais jovens da primeira trindade dos “Ampers” – GeForce RTX 2070 e RTX 2080 – estendido para RTX 3090, é bem-vindo.

Além disso, os jogadores que tiveram a sorte de comprar uma GeForce RTX 3080 na primeira semana após o lançamento, ao contrário do título da análise, não têm absolutamente nada a invejar no RTX 3090. Além do desempenho do RTX 3080, você poderia obter cerca de 12% FPS no caso mais favorável, ao jogar em 4K- tela, por um pagamento adicional de 00. E isso é fornecido para que os preços de varejo de novos produtos NVIDIA, pelo menos algum tempo depois, alcancem os recomendados. Se o RTX 3080 instantaneamente se tornar um produto escasso, comprar um RTX 3090, especialmente por um valor lucrativo, será ainda mais difícil.

Por outro lado, tente nomear outra placa de vídeo que tenha 12% mais desempenho do que a GeForce RTX 3080. Esta última carecia exatamente desses 12% FPS para rodar quase qualquer título, incluindo títulos extremamente exigentes como Control, Metro Exodus e Red Dead Redemption 2 (os dois primeiros sem traçado de raio), em velocidade máxima e em 4K com uma taxa de quadros de 60 FPS, ou elimina completamente a necessidade de DLSS ao jogar no modo 1440p com traçado de raio. O dimensionamento de quadros com DLSS ainda é inevitável para obter tudo: resolução de 4K, configurações de detalhes máximas, traçado de raio e sólidos 60 FPS. Mas, dado que o DLSS tem apresentado um desempenho quase perfeito em suas iterações mais recentes, essa e outras tecnologias semelhantes se estabeleceram nos jogos por um longo tempo, se tanto em um futuro previsível.

E, no entanto, sejamos honestos: é muito difícil considerar a GeForce RTX 3090 uma compra racional apenas para entretenimento. Mesmo o argumento de 24 GB de RAM tem até agora apenas peso no contexto de jogar em TVs e monitores com uma resolução de 8K, que são propriedade de uma pequena porcentagem de jogadores que estão desaparecendo, e a versão hipotética do RTX 3080 com 20 GB de VRAM ainda custará menos. O GeForce RTX 3090 cumpre plenamente seu valor em situações em que tempo é igual a dinheiro, ou seja, em tarefas profissionais que requerem potência máxima de processamento e uma grande quantidade de GPU RAM. Em software de edição de vídeo de alta resolução com efeitos complexos, o RTX 3090 pode reduzir significativamente os tempos de renderização, mesmo em comparação com o RTX 3080. Ele renderiza o traçado de raios no Blender 25% mais rápido do que o RTX 3080, ou mais do que o dobro da velocidade da solução anterior de prosumer da NVIDIA – TITAN RTX. Além disso, há uma série de tarefas que são amplamente fechadas para aceleradores com menos memória local – por exemplo, modelagem 3D de projetos complexos ou edição de vídeo com

Finalmente, vamos dizer algumas palavras sobre a placa de vídeo Palit GamingPro OC, que é a GeForce RTX 3090 em nosso teste. A Palit usou o mesmo projeto de sistema de resfriamento e PCBs semelhantes em suas versões RTX 3080 e RTX 3090, apenas ampliando o VRM para corresponder ao maior consumo de energia do modelo antigo. Como resultado, quase tudo o que já falamos sobre o Palit GeForce RTX 3080 GamingPro OC se refere ao relativo RTX 3090. A placa de vídeo dá a impressão de um produto de qualidade e fornece refrigeração adequada ao chip GA102. Porém, o aumento no consumo de energia não passou despercebido pelo nível de ruído (350 W não é brincadeira), e o comprador do modelo carro-chefe deve prestar muita atenção na ventilação do micro, já que o cooler deixa quase todo o ar quente dentro do gabinete.

avalanche

Postagens recentes

Os cientistas resolveram o mistério de Urano, com o qual lutam há quase 40 anos.

Uma das missões promissoras até 2032 é enviar uma sonda a Urano. Os cientistas estão…

9 minutos atrás

O chefe da Samsung vai limpar a empresa da alta administração desajeitada na área de chips

Uma década depois de o herdeiro de terceira geração da Samsung, Lee Jae-yong, ter assumido…

6 horas atrás

World of Warcraft completa 20 anos e ainda é o RPG mais popular do mundo.

Há exatos 20 anos, em 23 de novembro de 2004, World of Warcraft foi lançado,…

7 horas atrás