A NVIDIA, juntamente com o provedor de nuvem Amazon Web Services (AWS), introduziu uma série de novas soluções conjuntas, principalmente relacionadas à IA. As empresas anunciaram poderosos sistemas NVIDIA GH200 NVL32 para treinamento e execução de redes neurais, e também anunciaram a criação do supercomputador de IA em nuvem mais poderoso do mundo, o Projeto Ceiba, baseado nesses sistemas.
Projeto Ceiba. Fonte da imagem: NVIDIA
NVIDIA GH200 NVL32 é um sistema pronto projetado no formato de um rack de servidor padrão. Ele combina 32 aceleradores híbridos NVIDIA GH200 Grace Hopper Superchip, que são um sistema de chip duplo que consiste em um processador central com 72 núcleos Arm Neoverse e um processador gráfico NVIDIA H100. Esse rack será capaz de fornecer desempenho excepcional – até 128 Pflops em operações FP8 (quatrilhões de operações por segundo).
Superchip NVIDIA GH200 Grace Hopper
O sistema possui 2.304 núcleos de processador Arm, 20 TB de RAM, incluindo 4,5 TB de HBM3e com uma taxa de transferência total de 157 TB/s. Nove NVSwitches e uma interface NVLink com throughput total de 57,6 TB/s são responsáveis pela comunicação entre os superchips GH200. Um sistema de refrigeração líquida é usado. A AWS será a primeira a oferecer sistemas GH200 NVL32 como parte da plataforma NVIDIA DGX Cloud. Além disso, a Amazon permitirá que os clientes combinem novos sistemas NVIDIA em EC2 UltraClusters, recebendo milhares de aceleradores GH200 Superchip à sua disposição. Segundo a própria NVIDIA, os sistemas GH200 NVL32 são ideais tanto para treinar quanto para executar grandes redes neurais – mesmo com 1 trilhão de parâmetros.
Dispositivo NVIDIA GH200 NVL32
As empresas também anunciaram a criação do Projeto Ceiba, o supercomputador baseado em GPU mais rápido do mundo para IA. O sistema fornecerá desempenho de 65 Exaflops (FP8). Ele combinará 16.384 aceleradores GH200, bem como 9,1 PB de memória e fornecerá uma taxa de transferência total de interconexão de 410 TB/s. O supercomputador fará parte da nuvem AWS DGX e estará disponível para clientes da AWS no próximo ano.
A administração da plataforma Reddit anunciou que atualizará as exceções para robôs (arquivo robots.txt), que…
A Vivo apresentou o smartphone de gama média Vivo Y28s 5G. Se você acha que…
Um grupo de entusiastas do Rabbitude que fazem engenharia reversa do dispositivo Rabbit R1 AI…
Marc Whitten, um engenheiro e veterano da indústria de jogos que esteve na vanguarda do…
A OpenAI adiou o lançamento de seu tão aguardado recurso de assistente de voz ChatGPT…
A editora Bandai Namco e os desenvolvedores do estúdio FromSoftware anunciaram o lançamento do primeiro…