A NVIDIA, juntamente com o provedor de nuvem Amazon Web Services (AWS), introduziu uma série de novas soluções conjuntas, principalmente relacionadas à IA. As empresas anunciaram poderosos sistemas NVIDIA GH200 NVL32 para treinamento e execução de redes neurais, e também anunciaram a criação do supercomputador de IA em nuvem mais poderoso do mundo, o Projeto Ceiba, baseado nesses sistemas.

Projeto Ceiba. Fonte da imagem: NVIDIA

NVIDIA GH200 NVL32 é um sistema pronto projetado no formato de um rack de servidor padrão. Ele combina 32 aceleradores híbridos NVIDIA GH200 Grace Hopper Superchip, que são um sistema de chip duplo que consiste em um processador central com 72 núcleos Arm Neoverse e um processador gráfico NVIDIA H100. Esse rack será capaz de fornecer desempenho excepcional – até 128 Pflops em operações FP8 (quatrilhões de operações por segundo).

Superchip NVIDIA GH200 Grace Hopper

O sistema possui 2.304 núcleos de processador Arm, 20 TB de RAM, incluindo 4,5 TB de HBM3e com uma taxa de transferência total de 157 TB/s. Nove NVSwitches e uma interface NVLink com throughput total de 57,6 TB/s são responsáveis ​​pela comunicação entre os superchips GH200. Um sistema de refrigeração líquida é usado. A AWS será a primeira a oferecer sistemas GH200 NVL32 como parte da plataforma NVIDIA DGX Cloud. Além disso, a Amazon permitirá que os clientes combinem novos sistemas NVIDIA em EC2 UltraClusters, recebendo milhares de aceleradores GH200 Superchip à sua disposição. Segundo a própria NVIDIA, os sistemas GH200 NVL32 são ideais tanto para treinar quanto para executar grandes redes neurais – mesmo com 1 trilhão de parâmetros.

Dispositivo NVIDIA GH200 NVL32

As empresas também anunciaram a criação do Projeto Ceiba, o supercomputador baseado em GPU mais rápido do mundo para IA. O sistema fornecerá desempenho de 65 Exaflops (FP8). Ele combinará 16.384 aceleradores GH200, bem como 9,1 PB de memória e fornecerá uma taxa de transferência total de interconexão de 410 TB/s. O supercomputador fará parte da nuvem AWS DGX e estará disponível para clientes da AWS no próximo ano.

avalanche

Postagens recentes

A FSUE GlavNIVC está desenvolvendo uma parceria com a desenvolvedora russa Basis.

A Empresa Estatal Unitária Federal "GlavNIVC", vinculada ao Departamento de Gestão de Propriedades Presidenciais da…

27 minutos atrás

A Tesla lançou robotáxis em mais duas cidades do Texas.

Esta semana, a Tesla publicará um relatório detalhado sobre seus últimos resultados trimestrais, por isso…

1 hora atrás

Elon Musk quer colocar os reguladores americanos contra seus homólogos europeus por discriminarem a SpaceX no mercado da UE.

A experiência política de Elon Musk pode ser interpretada de várias maneiras, mas, ainda no…

2 horas atrás

Os primeiros protótipos da memória HBM4E da Samsung estarão prontos no próximo mês.

Para a Samsung Electronics, é crucial garantir sua posição no mercado de HBM4E, fornecendo aos…

5 horas atrás

A construção do gigantesco centro de dados de IA de Trump está paralisada: sem clientes, CEO demitido, ações em queda livre.

O maior projeto de construção de um campus de data center de IA do mundo,…

9 horas atrás

A Alphabet está em negociações com a Marvell para desenvolver dois chips de IA para inferência.

A Alphabet iniciou negociações com a Marvell para desenvolver chips especializados capazes de executar modelos…

11 horas atrás