Nvidia revela GB300 Blackwell Ultra — poderoso acelerador de IA com 20.480 CUDA, 288 GB HBM3E e PCIe 6.0

A Nvidia divulgou informações detalhadas sobre o acelerador de IA Blackwell Ultra GB300. Ele difere de seu antecessor, o GB200, por ter um número maior de núcleos e memória, uma interface mais rápida e maior potência. O Nvidia GB300 é baseado em dois cristais com um total de 208 bilhões de transistores — eles são fabricados com a tecnologia TSMC 4NP e operam como um único processador gráfico (GPU) devido à interconexão NV-HBI com uma velocidade de 10 TB/s.

Fonte da imagem: nvidia.com

A GPU contém 160 Multiprocessadores de Streaming, cada um com 128 núcleos CUDA – um total de 20.480 núcleos, além de Tensor Cores de quinta geração com suporte para FP8, FP6 e o ​​novo formato NVFP4. Cada Multiprocessador de Streaming possui 256 KB de Memória Tensor (TMEM) – um total de 40 MB. Unidades de hardware adicionais também são fornecidas para cálculos e operações transcendentais otimizados para núcleos de computação.

A memória é organizada em oito pilhas HBM3E de 12 camadas, com um volume total de 288 GB. A largura de banda da memória do Nvidia GB300 não mudou em comparação com o GB200 — é de 8 TB/s, sendo organizada em 16 canais de 512 bits (interface de 8192 bits). A capacidade de memória aumentada permite colocar todo o modelo de IA no chip, além de armazenar grandes volumes de cache de chaves e valores sem descarregar para recursos externos. O indicador TGP aumentou para 1400 W.

A interface NVLink 5, com uma taxa de transferência de dados bidirecional de 1,8 TB/s por GPU, é responsável pela comunicação entre as GPUs. A comunicação entre a GPU e o processador central Grace é implementada através da interface NVLink-C2C com uma velocidade de 900 GB/s e suporte para um único espaço de endereço. O barramento PCIe 6.0 x16 com uma largura de banda bidirecional de 256 GB/s é usado para conexão com o host – esta interface foi usada pela primeira vez pela Nvidia. Os aceleradores podem ser instalados em um rack GB300 NVL72 com 72 GPUs, até 20,7 TB de memória HBM3E e uma largura de banda HBM total de 576 TB/s. O rack também possui 72 núcleos Grace Superchip Arm e até 480 GB de LPDDR5X com uma largura de banda de 512 GB/s.

NVFP4 é um novo formato de dados de baixa precisão implementado em núcleos tensores. Ele oferece precisão comparável à do FP8, mas utiliza 1,8 vez menos memória. Os aceleradores Nvidia GB300 já entraram em produção em massa e os primeiros clientes já os receberam.

admin

Postagens recentes

Conforme as cartas forem lançadas, conforme a rede ditar: a AWS está implementando uma arquitetura de rede RNG quase aleatória em seus data centers.

A AWS publicou uma descrição técnica da arquitetura de rede de data center que implementará…

15 horas atrás

O chefe da NASA afirma que os voos do foguete New Glenn não serão retomados antes de 2028, eliminando a Blue Origin da corrida lunar.

Durante um teste estático de ignição em 29 de maio de 2026, o foguete New…

15 horas atrás

Foi anunciado o sucessor espiritual de Zeus: Master of Olympus – o jogo de estratégia de construção de cidades Theos: Cities of Myth, onde história e mito se entrelaçam.

A editora Dotemu (Ninja Gaiden: Ragebound, Marvel Cosmic Invasion) e a Triskell Interactive, desenvolvedora de…

16 horas atrás

Plataforma de referência de IA Qualcomm Dragonwing IQ10 para robótica é apresentada.

Cristiano Amon, CEO da Qualcomm, apresentou a plataforma robótica Dragonwing IQ10 atualizada na Computex 2026.…

16 horas atrás

O RPG infernal baseado em turnos, Entropy, do criador de Dread Delusion, recebeu uma demo e uma data de lançamento no Acesso Antecipado do Steam.

A editora DreadXP e o estúdio britânico Lovely Hellplace (Dread Delusion) anunciaram a data de…

16 horas atrás