A AMD se gaba de que o Ryzen AI Max+ 395 é até 12x mais rápido em IA do que seu concorrente direto da Intel

O mais recente processador móvel AMD Ryzen AI Max+ 395 Strix Halo oferece desempenho até 12x mais rápido em uma variedade de grandes modelos de linguagem de IA do que os chips Intel Lunar Lake. A AMD relatou isso em seu blog oficial, compartilhando os diagramas correspondentes.

Fonte da imagem: AMD

Com 16 núcleos de computação Zen 5, 40 GPUs RDNA 3.5 e uma NPU XDNA 2 com desempenho de 50 TOPS (trilhões de operações por segundo), o Ryzen AI Max+ 395 oferece desempenho até 12,2x mais rápido em certos cenários LLM do que o Intel Core Ultra 258V. Vale lembrar que o chip Intel Lunar Lake tem apenas quatro núcleos P e quatro núcleos E, o que é metade do Ryzen AI Max+ 395. No entanto, a diferença de desempenho entre as plataformas é muito mais que o dobro.

A vantagem do chip Ryzen AI Max+ 395 se torna ainda mais perceptível à medida que a complexidade dos modelos de linguagem aumenta. A maior diferença de desempenho entre as plataformas é observada ao executar o LLM com 14 bilhões de parâmetros, o que requer mais RAM. Lembremos que o Lunar Lake é um processador híbrido equipado com até 32 GB de RAM on-board.

Em testes do LM Studio usando um Asus ROG Flow Z13 com 64 GB de memória unificada, os gráficos Radeon 8060S integrados do Ryzen AI Max+ 395 forneceram 2,2x a taxa de transferência de tokens dos gráficos Arc 140V da Intel em uma variedade de modelos de IA. Em testes de Time-to-First-Token (uma métrica de desempenho do modelo de linguagem que mede quanto tempo leva do envio de uma solicitação até a geração do primeiro token em uma resposta), o chip da AMD demonstrou uma vantagem quádrupla sobre seu concorrente em modelos como o Llama 3.2 3B Instruct, e aumentou a liderança para 9,1x em modelos que suportam 7 a 8 bilhões de parâmetros, como o DeepSeek R1 Distill.

O processador AMD se destacou particularmente em tarefas de visão multimodal, onde processou entradas visuais complexas até 7x mais rápido no IBM Granite Vision 3.2 3B e 6x mais rápido no Google Gemma 3 12B em comparação ao chip Intel. O suporte de plataforma da AMD para a tecnologia Variable Graphics Memory permite que até 96 GB de memória sejam alocados como VRAM de sistemas com até 128 GB de memória unificada, permitindo a implantação de modelos de linguagem modernos, como o Gemma 3 27B Vision do Google.

As vantagens de desempenho do processador AMD sobre seu concorrente também são visíveis em aplicações práticas de IA, como análise de imagens médicas e assistência de codificação com quantização de 6 bits de alta precisão no DeepSeek R1 Distill Qwen 32B.

avalanche

Postagens recentes

O Telegram entrou com um processo contestando o bloqueio na Índia.

A administração do aplicativo de mensagens Telegram entrou com uma ação judicial em um tribunal…

1 hora atrás

A NASA modernizou seu laboratório quântico na ISS, elevando os experimentos com átomos frios a um novo patamar.

Após uma modernização, a NASA reativou o Laboratório de Átomos Frios a bordo da Estação…

1 hora atrás

Genesis Eno, um robô humanoide que não tem aparência humana, foi apresentado.

A startup francesa Genesis AI, que tem como um de seus investidores o ex-CEO do…

1 hora atrás

O Windows 11 eliminará reinicializações desnecessárias: as atualizações serão instaladas em um único ciclo.

A Microsoft lançou a versão de pré-visualização do Windows 11 Insider, Build 26300.8687, para o…

2 horas atrás

Os EUA vão suspender a proibição da importação de drones chineses, mas apenas os de brinquedo.

A Comissão Federal de Comunicações (FCC) dos EUA anunciou sua intenção de permitir a importação…

2 horas atrás