Categorias: Mercado de tecnologia e TI. notícia

Até agora, apenas Intel Habana Gaudi2 pode competir com NVIDIA H100 no MLPerf

A Intel divulgou os resultados dos testes do acelerador Habana Gaudi2 no benchmark GPT-J (parte do MLPerf Inference v3.1), baseado em um modelo de linguagem grande (LLM) com 6 bilhões de parâmetros. Os dados obtidos sugerem que este produto pode se tornar uma alternativa à solução NVIDIA H100 no mercado de IA.

Em particular, no teste GPT-J, o acelerador H100 mostra uma vantagem de desempenho relativamente pequena sobre Gaudi2 – ×1,09 no modo servidor e ×1,28 no modo offline. Ao mesmo tempo, Gaudi2 supera o acelerador NVIDIA A100 em 2,4 vezes no modo servidor e 2 vezes no modo offline.

Além disso, a solução da Intel está à frente do H100 nos modelos BridgeTower. Este teste foi treinado em 4 milhões de imagens. Diz-se que a precisão da resposta visual a perguntas (VQAv2) chega a 78,73%. Quando ampliado, o modelo tem uma precisão ainda maior de 81,15%, superando os modelos treinados em conjuntos de dados muito maiores.

Fonte da imagem: Intel

O teste GPT-J fala da competitividade de Habana Gaudi2. Ao processar consultas on-line, esse acelerador atinge uma taxa de transferência de 78,58 amostras por segundo e, no modo off-line, atinge 84,08 amostras por segundo. Para efeito de comparação: para o NVIDIA H100 esses números são 85,57 e 107,33 amostras por segundo, respectivamente.

No futuro, a Intel planeja melhorar o desempenho e a cobertura do modelo nos testes MLPerf por meio de atualizações regulares de software. Mas a Intel ainda está se atualizando – a NVIDIA preparou uma ferramenta TensorRT-LLM aberta e gratuita, que não apenas dobra a velocidade de execução do LLM no H100, mas também oferece alguns ganhos de desempenho em aceleradores mais antigos.

avalanche

Próximo Yandex lançou um serviço de pagamento atualizado Pay com suporte para cartões de terceiros, cashback e pagamento por smartphone »

Anterior « Em breve, ônibus autônomos começarão a transportar passageiros no Japão – com motoristas de segurança por enquanto

Deixar comentário

Publicado por

avalanche

3 anos atrás

Postagens recentes

Espaço

A tripulação lunar da NASA chegou ao local de lançamento, poucos dias antes do lançamento da missão Artemis II.

Em 27 de março de 2026, a tripulação da missão tripulada Artemis II chegou ao…

1 hora atrás

Consoles de jogos

“Não parecia um Xbox”: Microsoft explica por que encerrou sua campanha “This is an Xbox”.

Com a chegada de Asha Sharma como chefe da Microsoft Gaming, a fabricante abandonou quase…

1 hora atrás

Vírus, cavalos de Troia, vulnerabilidades de software, problemas de segurança

“Ocultar meu e-mail” não garante anonimato – Apple revela usuário à polícia

A Apple, a pedido dos investigadores, forneceu informações que permitiram rastrear o remetente das ameaças…

1 hora atrás

Telefones celulares, smartphones, comunicações celulares, comunicadores, PDAs

O “smartphone de Trump” foi recentemente certificado pela FCC.

As ambições do atual presidente dos EUA, Donald Trump, culminaram, em certo momento, na criação…

4 horas atrás

Programas

A Microsoft tornará o Windows 11 mais estável ao restringir os requisitos de driver.

Este ano, a Microsoft planeja melhorar a estabilidade e o desempenho do Windows 11. Isso…

5 horas atrás

Servidores, clusters, supercomputadores, computadores industriais e multiprocessadores

A Microsoft assumirá o controle de um centro de dados de quase 1 GW no Texas, que a Oracle e a OpenAI não conseguiram construir.

No início de seu segundo mandato presidencial, Donald Trump participou do lançamento do Projeto Stargate,…

5 horas atrás

Até agora, apenas Intel Habana Gaudi2 pode competir com NVIDIA H100 no MLPerf

Conteúdo relacionado

Postagens recentes

A tripulação lunar da NASA chegou ao local de lançamento, poucos dias antes do lançamento da missão Artemis II.

“Não parecia um Xbox”: Microsoft explica por que encerrou sua campanha “This is an Xbox”.

“Ocultar meu e-mail” não garante anonimato – Apple revela usuário à polícia

O “smartphone de Trump” foi recentemente certificado pela FCC.

A Microsoft tornará o Windows 11 mais estável ao restringir os requisitos de driver.

A Microsoft assumirá o controle de um centro de dados de quase 1 GW no Texas, que a Oracle e a OpenAI não conseguiram construir.