NVIDIA iniciou a produção em massa de aceleradores H100

A NVIDIA anunciou o início da produção em série dos aceleradores de 4nm H100 (Hopper). Os parceiros começarão a oferecer soluções baseadas nessa arquitetura no próximo mês. O NVIDIA H100 usa um layout CoWoS 2.5D multi-chip e contém cerca de 80 bilhões de transistores.

A combinação do Gen 4 NVlink para conectividade GPU-a-GPU de 900 GB/s, NVSwitch para acelerar a comunicação coletiva nó-acelerador, PCIe 5.0 e software NVIDIA Magnum IO oferece escalabilidade eficiente de pequenas empresas a grandes clusters unificados.

Fonte da imagem: NVIDIA

De acordo com a NVIDIA, os novos aceleradores são 3,5 vezes mais eficientes em termos de energia do que os aceleradores da geração anterior e podem reduzir o custo total de propriedade por um fator de três, enquanto permitem uma redução de cinco vezes no número de nós de servidor para atingir o mesmo nível de desempenho de IA . Você pode aprender mais sobre os recursos arquitetônicos dos novos produtos aqui.

Fonte da imagem: NVIDIA

As instâncias baseadas em H100 pretendem implantar muitas plataformas de nuvem. Estes são Amazon Web Services, Google Cloud, Microsoft Azure e Oracle Cloud. E para aqueles que não podem esperar para conferir o que há de novo agora, eles podem ser acessados ​​agora como parte do NVIDIA Launchpad. Aceleradores também serão usados ​​em supercomputadores de próxima geração.

Servidores com essas soluções serão oferecidos pela Atos, Cisco, Dell Technologies, Fujitsu, Gigabyte, Hewlett Packard Enterprise, Lenovo e Supermicro. Até o final, mais de 50 modelos de servidores com novos aceleradores aparecerão no mercado e, no próximo ano, várias dezenas de soluções serão apresentadas. Além disso, juntamente com os servidores dará uma assinatura de cinco anos para NVIDIA AI Enterprise. E a própria NVIDIA já está aceitando pedidos de sistemas DGX.

avalanche

Postagens recentes

Os aplicativos de Smart TV estão consumindo dados da internet silenciosamente para treinar modelos de IA.

Empresas que coletam dados abertos da internet para treinar modelos de IA estão buscando cada…

16 minutos atrás

O aplicativo Claude alcançou o topo das paradas da App Store depois que o governo dos EUA atacou a Anthropic.

O aplicativo Claude da Anthropic para dispositivos iOS alcançou o primeiro lugar no ranking de…

2 horas atrás

As ações da Nvidia caíram 7% em uma semana, apesar de um relatório trimestral sólido.

Esta semana, a Nvidia não só divulgou uma receita trimestral recorde, superando as expectativas do…

6 horas atrás

As encomendas de produção de chips de 2nm da TSMC estão distribuídas pelos próximos dois anos.

A TSMC, de Taiwan, ultrapassou seus concorrentes no desenvolvimento de processos litográficos avançados, embora a…

6 horas atrás

A Huawei apresentará sistemas de supercomputação no MWC 2026 em Barcelona.

As fronteiras entre os gêneros tecnológicos estão se tornando cada vez mais tênues, portanto, a…

7 horas atrás