Os prazos de entrega dos aceleradores Nvidia H100 AI foram reduzidos para 2–3 meses

Os prazos de entrega dos aceleradores Nvidia H100 AI foram reduzidos de 3-4 para 2-3 meses (8-12 semanas), relata DigiTimes, citando uma declaração de Terence Liao, diretor do escritório da Dell em Taiwan. Os fornecedores ODM de equipamentos de servidor observam que a escassez de aceleradores especializados começou a diminuir em comparação com 2023, quando era quase impossível comprar uma Nvidia H100.

Fonte da imagem: NVIDIA

Segundo Liao, apesar da redução nos prazos de fornecimento de aceleradores de IA, a demanda por esses equipamentos no mercado ainda é extremamente elevada. E apesar do alto custo, o volume de compras de servidores de IA é significativamente maior do que as compras de equipamentos de servidores de uso geral.

O prazo de entrega de 2 a 3 meses é o menor prazo de entrega para aceleradores Nvidia H100 de todos os tempos. Apenas seis meses atrás, eram 11 meses. Ou seja, os clientes da Nvidia tiveram que esperar quase um ano para que seus pedidos fossem atendidos. Desde o início de 2024, os prazos de entrega diminuíram significativamente. No início, caíram para 3–4 meses e agora para 2–3 meses. Nesse ritmo, a escassez de aceleradores de IA poderá ser eliminada até o final deste ano ou até antes.

Parte dessa dinâmica pode ter a ver com os próprios compradores de aceleradores de IA. Algumas empresas que possuem H100 excedentes que não estão sendo usados ​​os estão revendendo para compensar o enorme custo de adquiri-los. Além disso, a situação atual pode ser uma consequência do facto de o fornecedor de computação em nuvem AWS ter simplificado o aluguer de aceleradores Nvidia H100 AI através da nuvem, o que por sua vez também ajuda parcialmente a reduzir a procura por eles.

Os únicos clientes da Nvidia que continuam a enfrentar desafios no fornecimento de hardware de IA são grandes empresas de IA como a OpenAI, que utilizam dezenas de milhares de aceleradores semelhantes para treinar de forma rápida e eficiente os seus grandes modelos de linguagem de IA.

avalanche

Postagens recentes

Conforme as cartas forem lançadas, conforme a rede ditar: a AWS está implementando uma arquitetura de rede RNG quase aleatória em seus data centers.

A AWS publicou uma descrição técnica da arquitetura de rede de data center que implementará…

20 horas atrás

O chefe da NASA afirma que os voos do foguete New Glenn não serão retomados antes de 2028, eliminando a Blue Origin da corrida lunar.

Durante um teste estático de ignição em 29 de maio de 2026, o foguete New…

20 horas atrás

Foi anunciado o sucessor espiritual de Zeus: Master of Olympus – o jogo de estratégia de construção de cidades Theos: Cities of Myth, onde história e mito se entrelaçam.

A editora Dotemu (Ninja Gaiden: Ragebound, Marvel Cosmic Invasion) e a Triskell Interactive, desenvolvedora de…

20 horas atrás

Plataforma de referência de IA Qualcomm Dragonwing IQ10 para robótica é apresentada.

Cristiano Amon, CEO da Qualcomm, apresentou a plataforma robótica Dragonwing IQ10 atualizada na Computex 2026.…

21 horas atrás

O RPG infernal baseado em turnos, Entropy, do criador de Dread Delusion, recebeu uma demo e uma data de lançamento no Acesso Antecipado do Steam.

A editora DreadXP e o estúdio britânico Lovely Hellplace (Dread Delusion) anunciaram a data de…

21 horas atrás