Categorias: Mercado de tecnologia e TI. notícia

NVIDIA atrasará o lançamento de aceleradores GB200, adiará B100/B200 e oferecerá B200A como substituto

A NVIDIA, de acordo com o The Information Resource, é forçada a atrasar o início da produção em massa de aceleradores de IA de próxima geração baseados na arquitetura Blackwell, enquanto mantém o alto ritmo de produção do Hopper. Diz-se que o problema está relacionado à tecnologia de embalagem Chip on Wafer on Substrate (CoWoS) da TSMC.

Note-se que a NVIDIA informou recentemente a Microsoft sobre atrasos que afetam as soluções mais avançadas da família Blackwell. Estamos falando, em particular, dos produtos Blackwell B200. A produção em série destes aceleradores pode ser adiada por pelo menos três meses – na melhor das hipóteses, até o primeiro trimestre de 2025. Isso poderia impactar os planos da Microsoft, Meta✴ e outros operadores de data center para expandir a capacidade para cargas de trabalho de IA e HPC.

Segundo a empresa de pesquisa SemiAnalysis, o atraso se deve ao design físico dos produtos da Blackwell. Estes são os primeiros aceleradores convencionais a usar a tecnologia de empacotamento CoWoS-L da TSMC. Esta é uma técnica complexa e altamente precisa que envolve o uso de um intermediário orgânico – o limite das capacidades da tecnologia CoWoS-S da geração anterior foi alcançado no AMD Instinct MI300X. Um intermediário de silício adequado para o B200 seria muito frágil. Porém, o interpositor orgânico não possui as melhores características elétricas, por isso pontes de silício são utilizadas para comunicação.

O principal problema está nos materiais utilizados – devido à diferença no coeficiente de dilatação térmica dos diversos componentes, surgem dobras que destroem os contatos e os próprios chips. Ao mesmo tempo, a exatidão e a precisão das conexões são extremamente importantes para o funcionamento da interconexão interna NV-HBI, que conecta dois blocos de computação a uma velocidade de 10 TB/s. Portanto, agora NVIDIA e TSMC estão ocupadas processando pontes e, segundo rumores, várias camadas de metalização dos próprios ladrilhos.

No entanto, a TSMC está enfrentando escassez de capacidade de embalagem CoWoS. A empresa tem aumentado as capacidades do CoWoS-S nos últimos dois anos, principalmente para atender às necessidades da NVIDIA, mas esta está agora migrando seus produtos para o CoWoS-L. Portanto, a TSMC está construindo uma fábrica de AP6 para a nova tecnologia de embalagem e também transferirá as capacidades existentes de AP3 para CoWoS-L. Ao mesmo tempo, os concorrentes da TSMC não podem e é improvável que consigam fornecer pelo menos alguma tecnologia de embalagem alternativa que seja adequada à NVIDIA num futuro próximo.

Assim, é relatado que a NVIDIA terá que decidir como utilizar a capacidade de produção disponível da TSMC. De acordo com a SemiAnalysis, a empresa está quase inteiramente focada nos superaceleradores de montagem em rack GB200 NVL36/72, que irão para hiperscaladores e um pequeno número de outros players, enquanto as soluções B100 e B200 HGX estão “agora efetivamente canceladas”, embora pequenas quantidades deste último ainda deverão chegar ao mercado. No entanto, a NVIDIA também tem um plano de backup.

O plano é lançar chips B200A monolíticos simplificados baseados em uma única matriz B102, que também servirá de base para o acelerador B20, voltado para a China. O B200A receberá apenas quatro pilhas HBM3e (144 GB, 4 TB/s), e seu TDP será de 700 ou 1000 W. Uma vantagem importante neste caso é a possibilidade de utilização de embalagens CoWoS-S. Os chips B200A acabarão em sistemas HGX de massa, em vez dos B100/B200 originalmente planejados.

O B200A será substituído pelo B200A Ultra, que terá maior desempenho, mas não haverá upgrade de memória. Eles também farão parte da plataforma HGX, mas isso não é o principal. Com base neles, a NVIDIA oferecerá superaceleradores de compromisso MGX GB200A Ultra NVL36. Eles receberão oito nós 2U, cada um com um processador Grace e quatro B200A Ultra de 700 W. Os aceleradores ainda serão totalmente integrados pelo barramento NVLink5 (switches 1U de chip único), mas dentro do nó toda a comunicação com a CPU será vinculada a switches PCIe em dois adaptadores ConnectX-8.

A principal vantagem do GX GB200A Ultra NVL36 será o resfriamento a ar devido à sua potência relativamente baixa – apenas 40 kW por rack. Isso é muito, mas ainda permitirá colocar novos produtos em muitos data centers sem seu reequipamento radical, embora ao custo de perder densidade de posicionamento (por exemplo, pular linhas). De acordo com a SemiAnalysis, esses superaceleradores, em caso de escassez de GB200 NVL72/36 “completos”, também serão adquiridos por hiperscaladores.

avalanche

Próximo A Imec belga conseguiu produzir pequenas estruturas semicondutoras recordes em uma passagem »

Anterior « O aplicativo móvel ChatGPT está aumentando a receita muito rapidamente graças ao GPT-4o

Deixar comentário

Publicado por

avalanche

2 anos atrás

Postagens recentes

A Altera estende o ciclo de vida dos FPGAs até 2045.

A Altera anunciou a extensão do ciclo de vida de seus produtos FPGA: algumas soluções…

2 horas atrás

Vírus, cavalos de Troia, vulnerabilidades de software, problemas de segurança

A OpenAI descobriu uma vulnerabilidade em um componente de terceiros de seus aplicativos – os dados do usuário estão seguros.

A OpenAI anunciou a descoberta de uma ameaça à segurança relacionada a um componente de…

2 horas atrás

SoC e chips controladores

O Japão destinou mais US$ 4 bilhões à Rapidus para lançar um processo de fabricação de chips de IA com tecnologia de 2 nanômetros.

O Ministério da Economia, Comércio e Indústria do Japão (METI) anunciou no sábado que fornecerá…

2 horas atrás

Notícias da rede

A OpenAI acusa Elon Musk de criar uma emboscada jurídica em um caso de 100 bilhões de dólares.

Elon Musk mudou repentinamente sua posição sobre as alegações em seu processo contra a OpenAI,…

3 horas atrás

Telefones celulares, smartphones, comunicações celulares, comunicadores, PDAs

A Xiaomi aumentou os preços dos smartphones Redmi K90 Pro Max e Redmi Turbo 5 na China.

A Xiaomi aumentou os preços de seus populares smartphones da linha Redmi no mercado chinês.…

4 horas atrás

Inteligência Artificial, Aprendizado de Máquina, Redes Neurais

A inteligência artificial (IA) provou ser péssima em apostas esportivas, perdendo tudo em partidas da Premier League inglesa.

Modelos de IA do Google, OpenAI, Anthropic e xAI perderam dinheiro virtual em apostas em…

4 horas atrás

NVIDIA atrasará o lançamento de aceleradores GB200, adiará B100/B200 e oferecerá B200A como substituto

Conteúdo relacionado

Postagens recentes

A Altera estende o ciclo de vida dos FPGAs até 2045.

A OpenAI descobriu uma vulnerabilidade em um componente de terceiros de seus aplicativos – os dados do usuário estão seguros.

O Japão destinou mais US$ 4 bilhões à Rapidus para lançar um processo de fabricação de chips de IA com tecnologia de 2 nanômetros.

A OpenAI acusa Elon Musk de criar uma emboscada jurídica em um caso de 100 bilhões de dólares.

A Xiaomi aumentou os preços dos smartphones Redmi K90 Pro Max e Redmi Turbo 5 na China.

A inteligência artificial (IA) provou ser péssima em apostas esportivas, perdendo tudo em partidas da Premier League inglesa.