A AMD disse que sua placa de vídeo principal Radeon RX 7900 XTX oferece maior desempenho em comparação com o GeForce RTX 4090 e o RTX 4080 Super em trabalhar com o modelo Deepseek R1 II. De acordo com David McAfee, gerente geral dos processadores de clientes da AMD, seu carro -chefe na arquitetura RDNA 3 ignoram o RTX 4090 a 13 % e o RTX 4080 Super Model – até 34 % nessas tarefas.

Fonte da imagem: AMD

A AMD testou três placas de vídeo com várias configurações do DeepSeek R1. O modelo Radeon RX 7900 XTX forneceu a superioridade mais significativa sobre o RTX 4090 no trabalho com o Deepseek R1 Destill Qwen 7b (7 bilhões de parâmetros), onde a geração ADA Lovelace em 13 %. Em três outras configurações de LLM, o cartão AMD também foi mais eficaz que um concorrente: em duas tarefas destilando a llama 8b (8 bilhões de parâmetros), sua superioridade foi de 11 % e, no Destill Qwen 14b (14 bilhões de parâmetros), foi 2 % mais rápido . O modelo GeForce RTX 4090 foi mais rápido que o Radeon RX 7900 XTX em apenas uma configuração LLM – Destill Qwen 32b (32 bilhões de parâmetros), onde sua superioridade foi de 4 %.

A AMD também comparou o Radeon RX 7900 XTX e o GeForce RTX 4080 Super. Ao trabalhar com o Deepseek R1 Destill Qwen 7b (7 bilhões de parâmetros), o cartão vermelho mostrou 34 % de superioridade sobre o concorrente. Nas tarefas do destill llama 8b e destilar Qwen 14b, a vantagem da placa de vídeo da AMD diminuiu para 27 e 22 %, respectivamente.

De acordo com o hardware do portal Tom, os resultados dos testes fornecidos pela AMD devem ser percebidos com um certo grau de ceticismo. Em primeiro lugar, estamos falando de testes internos da empresa, e não sobre testes independentes. Em segundo lugar, não se sabe como as placas de vídeo da NVIDIA foram configuradas para esses testes. No final, nem todas as cargas de trabalho da IA ​​exigem o uso de todos os recursos computacionais da GPU. Por exemplo, a difusão estável pode não usar cálculos de FP8 ou código de tensort para processamento.

Os cartões Radeon RX 7900 XTX são usados ​​com pouca frequência como aceleradores de IA especializados, mas sua arquitetura permite que isso faça isso. O rDNA 3 no Radeon RX 7900 XTX é capaz de executar operações da matriz, suportando os cálculos de BF16 e INT8. A AMD usa até oficialmente a frase “acelerador” em materiais de publicidade sobre a arquitetura do RDNA 3 para demonstrar suas capacidades nas tarefas da inteligência artificial. O processador gráfico Radeon RX 7900 XTX contém 192 unidades de aceleração da IA.

Anteriormente, a AMD também publicou instruções sobre como usar o novo modelo Deepseek R1 II em seu hardware de consumo, incluindo a placa de vídeo Radeon RX 7900 XTX.

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *