Intel Gaudi2 continua sendo o único concorrente do NVIDIA H100 no benchmark MLPerf Inference

A Intel anunciou que seu acelerador Habana Gaudi2 AI continua sendo a única alternativa ao NVIDIA H100 testado no benchmark MLPerf Inference 4.0. Ao mesmo tempo, diz-se que Gaudi2 oferece alto desempenho por dólar, embora sejam os chips NVIDIA os líderes indiscutíveis.

Observa-se que para a plataforma Gaudi2, a Intel continua a expandir o suporte para modelos populares de linguagem grande (LLM) e modelos multimodais. Em particular, para MLPerf Inference v4.0, a corporação apresentou resultados para Stable Diffusion XL e Llama v2-70B.

De acordo com os resultados dos testes, no caso do Stable Diffusion XL, o acelerador H100 supera o Gaudi2 em 2,1 vezes no modo offline e 2,16 vezes no modo servidor. Ao processar o Llama v2-70B, o ganho é mais significativo – 2,76 vezes e 3,35 vezes, respectivamente. No entanto, na maioria dessas tarefas (exceto no modo de servidor Llama v2-70B), a solução Gaudi2 supera o H100 em termos de desempenho por dólar.

Fonte da imagem: Intel

No geral, o acelerador Gaudi2 AI em Stable Diffusion XL alcançou 6,26 e 6,25 amostras por segundo para modo offline e modo servidor, respectivamente. No caso do Llama v2-70B, foram alcançados 8.035,0 e 6.287,5 tokens por segundo, respectivamente.

Afirma-se também que os processadores de servidor Intel Xeon Emerald Rapids, graças a melhorias nos componentes de hardware e software no benchmark MLPerf Inference v3.1, demonstram em média valores 1,42 vezes maiores em comparação aos chips Xeon Sapphire Rapids. Por exemplo, para GPT-J com otimização de software e para DLRMv2, foi registrado um aumento no desempenho de aproximadamente 1,8 vezes.

avalanche

Postagens recentes

A Microsoft ensinará o Xbox a converter discos de jogos em licenças digitais.

A Microsoft começou a testar o recurso Disc2Digital para converter jogos físicos licenciados para formato…

2 horas atrás

Mass Effect fica a desejar: ao contrário das expectativas dos jogadores, Exodus não terá um editor de personagens completo.

A Archetype Entertainment, veterana da BioWare, esclareceu um dos elementos mais obscuros de seu RPG…

2 horas atrás

A GeForce RTX 5090D tornou-se a primeira placa gráfica Blackwell cuja GPU atingiu 4 GHz.

A equipe de overclocking da OGS publicou um resultado de overclock de GPU para uma…

4 horas atrás

O Chrome 150 foi lançado, corrigindo quase 400 vulnerabilidades, incluindo 15 críticas.

Há um mês, o Google anunciou a correção de 429 vulnerabilidades no navegador Chrome, 22…

4 horas atrás

“Parece mais uma piada”: Sony decepcionou assinantes com o anúncio da seleção de jogos da PS Plus para julho.

Hoje, 1º de julho, a PlayStation já "alegrou" os usuários com notícias sobre o iminente…

4 horas atrás

Os desenvolvedores de Subnautica 2 finalmente receberão os bônus em dinheiro que merecem da Krafton, e o antigo novo CEO está deixando o estúdio novamente.

O sucesso do simulador de sobrevivência Subnautica 2, da Unknown Worlds Entertainment (UW), empresa americana…

5 horas atrás