Intel Gaudi2 continua sendo o único concorrente do NVIDIA H100 no benchmark MLPerf Inference

A Intel anunciou que seu acelerador Habana Gaudi2 AI continua sendo a única alternativa ao NVIDIA H100 testado no benchmark MLPerf Inference 4.0. Ao mesmo tempo, diz-se que Gaudi2 oferece alto desempenho por dólar, embora sejam os chips NVIDIA os líderes indiscutíveis.

Observa-se que para a plataforma Gaudi2, a Intel continua a expandir o suporte para modelos populares de linguagem grande (LLM) e modelos multimodais. Em particular, para MLPerf Inference v4.0, a corporação apresentou resultados para Stable Diffusion XL e Llama v2-70B.

De acordo com os resultados dos testes, no caso do Stable Diffusion XL, o acelerador H100 supera o Gaudi2 em 2,1 vezes no modo offline e 2,16 vezes no modo servidor. Ao processar o Llama v2-70B, o ganho é mais significativo – 2,76 vezes e 3,35 vezes, respectivamente. No entanto, na maioria dessas tarefas (exceto no modo de servidor Llama v2-70B), a solução Gaudi2 supera o H100 em termos de desempenho por dólar.

Fonte da imagem: Intel

No geral, o acelerador Gaudi2 AI em Stable Diffusion XL alcançou 6,26 e 6,25 amostras por segundo para modo offline e modo servidor, respectivamente. No caso do Llama v2-70B, foram alcançados 8.035,0 e 6.287,5 tokens por segundo, respectivamente.

Afirma-se também que os processadores de servidor Intel Xeon Emerald Rapids, graças a melhorias nos componentes de hardware e software no benchmark MLPerf Inference v3.1, demonstram em média valores 1,42 vezes maiores em comparação aos chips Xeon Sapphire Rapids. Por exemplo, para GPT-J com otimização de software e para DLRMv2, foi registrado um aumento no desempenho de aproximadamente 1,8 vezes.

avalanche

Postagens recentes

É melhor ter uma usina nuclear atrás de casa do que um centro de dados: os americanos perderam a simpatia pelos centros de dados.

Uma pesquisa da Gallup mostra que a maioria dos americanos se opõe à construção de…

25 minutos atrás

A Pragmata tornou-se a mais recente vítima da pirataria – o jogo foi hackeado sem um hipervisor.

Após o aclamado jogo de ação e terror Resident Evil Requiem, outro lançamento da editora…

25 minutos atrás

“Desperdício de dinheiro e tempo”: Forza Horizon 6 foi lançado no Steam com críticas mistas e o melhor pico online da série.

Embora o lançamento de Forza Horizon 6, o jogo de corrida arcade de mundo aberto…

25 minutos atrás

O mercado de criptomoedas teme os hackers de IA: o setor DeFi, avaliado em US$ 130 bilhões, está sob ataque.

Em abril, dois grandes ataques cibernéticos atingiram serviços de finanças descentralizadas (DeFi), causando aos atacantes…

25 minutos atrás

A DJI anunciou a câmera de cinema de bolso Osmo Pocket 4P em Cannes.

A DJI escolheu o Festival de Cinema de Cannes para anunciar a Osmo Pocket 4P,…

25 minutos atrás

Aplicativos de terceiros estarão disponíveis nos óculos inteligentes Meta Ray-Ban Display.

Os óculos inteligentes Meta✴Ray-Ban Display contam com software de ponta, mas atualmente possuem uma desvantagem:…

50 minutos atrás