A AMD está prestes a apresentar a estação de trabalho compacta Ryzen AI Halo, com pré-vendas a partir do próximo mês. A versão de 128 GB terá preço inicial de US$ 3.999. A empresa posiciona o dispositivo como uma alternativa local a sistemas em nuvem acessíveis por API, bem como ao Nvidia DGX Spark para programação intuitiva: segundo os cálculos da empresa, com oito horas de trabalho de IA por dia, o sistema pode gerar uma economia de até US$ 750 por mês para o desenvolvedor.

Fonte da imagem: amd.com

O preço parece alto para um mini PC com IA, especialmente considerando que hardware similar custava entre US$ 2.200 e US$ 2.999 há menos de um ano. A AMD, no entanto, não está focando na acessibilidade, mas sim em substituir os custos regulares de nuvem e fornecer um ambiente pronto para executar modelos de IA localmente. Aliás, o preço do Nvidia DGX Spark também aumentou: agora ele é vendido por US$ 4.699, contra US$ 3.999 no outono passado.

O Ryzen AI Halo é baseado na APU Ryzen AI Max+ 395 de 120 watts. Seu chassi de 150 x 150 x 43 mm abriga 16 núcleos Zen 5, 40 unidades de computação de GPU RDNA 3.5 e 128 GB de memória LPDDR5x com taxa de transferência de 8000 MT/s. A memória é compartilhada entre a CPU e a GPU, e sua largura de banda atinge 256 GB/s.

De acordo com os cálculos da AMD, executar modelos localmente no Ryzen AI Halo em vez de APIs na nuvem pode reduzir os custos de desenvolvimento para US$ 750 por mês para uma carga de trabalho diária de oito horas.

Isso é suficiente para executar modelos de IA locais com até 200 bilhões de parâmetros. Nesse aspecto, o Ryzen AI Halo se equipara ao mais caro DGX Spark. Os gráficos integrados da AMD oferecem aproximadamente 56 teraflops com precisão de 16 bits, mas isso representa uma queda de 55% a 88% em relação ao desempenho declarado do Spark. Ao contrário do Blackwell GB10 no sistema da Nvidia, o Strix Halo não oferece suporte a FP8 e FP4 por hardware.

A diferença no desempenho teórico não será perceptível em todas as cargas de trabalho. A AMD afirma que, ao inferir grandes modelos de linguagem (LLM), ou seja, gerar respostas a partir de um modelo já treinado, o Ryzen AI Halo produz tokens de 4% a 14% mais rápido que o DGX Spark. Isso ocorre porque a velocidade de geração de tokens depende mais da largura de banda da memória do que da potência computacional máxima. Ao processar prompts longos, gerar imagens e re-treinar modelos, o Spark pode ser mais rápido graças aos seus Tensor Cores mais poderosos.

O Ryzen AI Halo tem duas vantagens sobre o Spark. A primeira é sua unidade de processamento neural (NPU) baseada em XDNA 2, com um desempenho declarado de 50 TOPS (trilhões de operações por segundo). Sua utilidade depende da aplicação: alguns programas de criação de conteúdo já utilizam a NPU, mas ainda são poucos os mecanismos de IA generativa com suporte completo para essa unidade. A segunda vantagem é sua plataforma x86 padrão. O Ryzen AI Halo pode executar Windows ou qualquer distribuição Linux, enquanto o Spark está vinculado a uma versão ligeiramente modificada do Ubuntu 24.04.

Em termos de recursos de rede, o sistema AMD é inferior ao sistema Nvidia. O DGX Spark é equipado com um adaptador ConnectX-7 de 200 Gbps e foi projetado para interconectar vários sistemas. O Ryzen AI Halo possui uma única porta de 10 Gbps. Isso é suficiente para carregar arquivos de modelos grandes, mas não para clustering. Teoricamente, redes de alta velocidade poderiam ser implementadas via USB4, mas a AMD ainda não descreveu tal cenário.

Um dos principais recursos oferecidos pela AMD são os playbooks de software. Desenvolvedores de IA e aprendizado de máquina (ML) frequentemente perdem tempo com versões incompatíveis de drivers, ROCm, HIP, SYCL, CUDA, PyTorch, TensorFlow e JAX. A AMD oferece ambientes prontos para uso com vLLM, Llama.cpp, Ollama, ComfyUI e outras ferramentas, o que deve reduzir o tempo de configuração.

No lançamento, o Ryzen AI Halo virá com cinco playbooks pré-instalados — scripts prontos para uso para configurar e executar cargas de trabalho. Outros 10 estarão disponíveis online, e a AMD promete adicionar novos playbooks mensalmente. Os compradores também terão acesso ao Programa de Desenvolvedores da AMD, créditos na nuvem e playbooks exclusivos.

A versão de 128 GB do Ryzen AI Halo estará disponível para pré-venda no próximo mês, a partir de US$ 3.999.A AMD já está preparando uma variante com 192 GB de memória para a APU Ryzen AI Max+ 495 atualizada. Ela receberáUm aumento moderado nas frequências da CPU, GPU e NPU, sem grandes alterações arquitetônicas, mas com uma quantidade maior de memória unificada, permitirá a execução de modelos de IA maiores.

By admin

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *