A AMD se gaba de que o Ryzen AI Max+ 395 é até 12x mais rápido em IA do que seu concorrente direto da Intel

O mais recente processador móvel AMD Ryzen AI Max+ 395 Strix Halo oferece desempenho até 12x mais rápido em uma variedade de grandes modelos de linguagem de IA do que os chips Intel Lunar Lake. A AMD relatou isso em seu blog oficial, compartilhando os diagramas correspondentes.

Fonte da imagem: AMD

Com 16 núcleos de computação Zen 5, 40 GPUs RDNA 3.5 e uma NPU XDNA 2 com desempenho de 50 TOPS (trilhões de operações por segundo), o Ryzen AI Max+ 395 oferece desempenho até 12,2x mais rápido em certos cenários LLM do que o Intel Core Ultra 258V. Vale lembrar que o chip Intel Lunar Lake tem apenas quatro núcleos P e quatro núcleos E, o que é metade do Ryzen AI Max+ 395. No entanto, a diferença de desempenho entre as plataformas é muito mais que o dobro.

A vantagem do chip Ryzen AI Max+ 395 se torna ainda mais perceptível à medida que a complexidade dos modelos de linguagem aumenta. A maior diferença de desempenho entre as plataformas é observada ao executar o LLM com 14 bilhões de parâmetros, o que requer mais RAM. Lembremos que o Lunar Lake é um processador híbrido equipado com até 32 GB de RAM on-board.

Em testes do LM Studio usando um Asus ROG Flow Z13 com 64 GB de memória unificada, os gráficos Radeon 8060S integrados do Ryzen AI Max+ 395 forneceram 2,2x a taxa de transferência de tokens dos gráficos Arc 140V da Intel em uma variedade de modelos de IA. Em testes de Time-to-First-Token (uma métrica de desempenho do modelo de linguagem que mede quanto tempo leva do envio de uma solicitação até a geração do primeiro token em uma resposta), o chip da AMD demonstrou uma vantagem quádrupla sobre seu concorrente em modelos como o Llama 3.2 3B Instruct, e aumentou a liderança para 9,1x em modelos que suportam 7 a 8 bilhões de parâmetros, como o DeepSeek R1 Distill.

O processador AMD se destacou particularmente em tarefas de visão multimodal, onde processou entradas visuais complexas até 7x mais rápido no IBM Granite Vision 3.2 3B e 6x mais rápido no Google Gemma 3 12B em comparação ao chip Intel. O suporte de plataforma da AMD para a tecnologia Variable Graphics Memory permite que até 96 GB de memória sejam alocados como VRAM de sistemas com até 128 GB de memória unificada, permitindo a implantação de modelos de linguagem modernos, como o Gemma 3 27B Vision do Google.

As vantagens de desempenho do processador AMD sobre seu concorrente também são visíveis em aplicações práticas de IA, como análise de imagens médicas e assistência de codificação com quantização de 6 bits de alta precisão no DeepSeek R1 Distill Qwen 32B.

avalanche

Postagens recentes

A rede neural Gemini começará a explicar aos usuários por que eles devem comprar um determinado produto.

O Google apresentou uma grande atualização nos formatos de anúncios de seu mecanismo de busca.…

19 minutos atrás

A receita da Nvidia disparou 85%, atingindo o recorde de US$ 81,6 bilhões no último trimestre.

O relatório trimestral da Nvidia se destaca não apenas cronologicamente, mas também nos permite avaliar…

34 minutos atrás

Zuckerberg tranquilizou os funcionários da Meta: não são esperadas novas demissões em massa este ano.

O CEO da Meta, Mark Zuckerberg, disse aos funcionários em um memorando interno que não…

6 horas atrás

Os primeiros testes da Lisuan LX 7G100 mostraram que a China aprendeu a fabricar GPUs para jogos modernos, mas elas ainda não são rápidas.

O canal do YouTube Chaowanke publicou uma das primeiras análises independentes de jogos da Lisuan…

7 horas atrás

A Microsoft contratou o renomado analista Matthew Ball para ajudar a direcionar sua estratégia para o Xbox.

A Microsoft continua a reestruturar a alta administração de sua divisão de jogos. Matthew Ball,…

7 horas atrás

A Samsung evitou uma greve que poderia ter aumentado os preços da memória, graças a bônus maiores concedidos aos trabalhadores.

O sindicato dos trabalhadores da Samsung Electronics anunciou a suspensão da greve que começaria na…

8 horas atrás