NVIDIA iniciou a produção em massa de aceleradores H100

A NVIDIA anunciou o início da produção em série dos aceleradores de 4nm H100 (Hopper). Os parceiros começarão a oferecer soluções baseadas nessa arquitetura no próximo mês. O NVIDIA H100 usa um layout CoWoS 2.5D multi-chip e contém cerca de 80 bilhões de transistores.

A combinação do Gen 4 NVlink para conectividade GPU-a-GPU de 900 GB/s, NVSwitch para acelerar a comunicação coletiva nó-acelerador, PCIe 5.0 e software NVIDIA Magnum IO oferece escalabilidade eficiente de pequenas empresas a grandes clusters unificados.

Fonte da imagem: NVIDIA

De acordo com a NVIDIA, os novos aceleradores são 3,5 vezes mais eficientes em termos de energia do que os aceleradores da geração anterior e podem reduzir o custo total de propriedade por um fator de três, enquanto permitem uma redução de cinco vezes no número de nós de servidor para atingir o mesmo nível de desempenho de IA . Você pode aprender mais sobre os recursos arquitetônicos dos novos produtos aqui.

Fonte da imagem: NVIDIA

As instâncias baseadas em H100 pretendem implantar muitas plataformas de nuvem. Estes são Amazon Web Services, Google Cloud, Microsoft Azure e Oracle Cloud. E para aqueles que não podem esperar para conferir o que há de novo agora, eles podem ser acessados ​​agora como parte do NVIDIA Launchpad. Aceleradores também serão usados ​​em supercomputadores de próxima geração.

Servidores com essas soluções serão oferecidos pela Atos, Cisco, Dell Technologies, Fujitsu, Gigabyte, Hewlett Packard Enterprise, Lenovo e Supermicro. Até o final, mais de 50 modelos de servidores com novos aceleradores aparecerão no mercado e, no próximo ano, várias dezenas de soluções serão apresentadas. Além disso, juntamente com os servidores dará uma assinatura de cinco anos para NVIDIA AI Enterprise. E a própria NVIDIA já está aceitando pedidos de sistemas DGX.

avalanche

Postagens recentes

A Meta lançará um aplicativo independente para o Vibes, o app de mensagens com inteligência artificial.

A Meta✴ está desenvolvendo um aplicativo independente para seu serviço Vibes, um feed de vídeos…

33 minutos atrás

Um robô assustador, quase indistinguível de um humano ao toque, foi apresentado na China.

Em Xangai, a empresa chinesa DroidUp (Zhuoyide Robotics) apresentou o robô humanoide Moya, anunciando-o como…

59 minutos atrás

Sem a escassez de HBM: a Positron AI está preparando um acelerador Asimov AI com terabytes de LPDRR5x.

A Positron AI anunciou que captou US$ 230 milhões em uma rodada de financiamento Série…

2 horas atrás

Por enquanto, não haverá novas placas GeForce RTX, e a Nvidia também reduzirá a produção das placas gráficas existentes em 30 a 40%.

O boom da IA ​​causou não apenas escassez de memória, mas também alta demanda pelos…

3 horas atrás

A Microsoft ocultou as configurações de armazenamento do Windows 11 dos usuários comuns.

A Microsoft atualizou as regras de segurança do Windows 11. Agora, são necessários privilégios de…

3 horas atrás