Categorias: Módulos de RAM, cartões de memória, pen drives, leitores de cartões

Jensen Huang explicou na CES 2026 por que a SRAM não substituirá a cara HBM em aceleradores de IA.

O CEO da Nvidia, Jensen Huang, explicou por que a SRAM não substituirá a memória de alta largura de banda (HBM) em sistemas de IA. Em uma sessão de perguntas e respostas na CES 2026 em Las Vegas, ele respondeu às especulações de que a empresa poderia abandonar a cara HBM em favor de componentes mais baratos.

Fonte da imagem: Tom’s Hardware

De acordo com o Tom’s Hardware, Huang delineou uma visão de que o requisito fundamental para hardware de IA não é a especialização restrita, mas sim a flexibilidade, que é precisamente o que a memória HBM proporciona. Seu principal argumento centra-se na natureza instável e em constante mudança das cargas de trabalho de IA. Os modelos evoluem rapidamente e novas arquiteturas e modalidades são introduzidas, tornando a otimização de hardware para uma única tarefa ineficaz a longo prazo. Embora Huang tenha reconhecido que as soluções centradas em SRAM podem oferecer velocidade incrível em certos cenários e evitar a latência inerente à memória externa, elas enfrentam severas limitações de capacidade ao serem escaladas. Embora tais aceleradores pareçam atraentes em testes controlados, em aplicações do mundo real eles não conseguem oferecer o equilíbrio entre largura de banda e densidade que a HBM proporciona.

O CEO da Nvidia também abordou o tema dos modelos de IA abertos, cuja proliferação deverá reduzir a dependência de GPUs caras. Ele reconheceu o valor desses modelos, mas enfatizou que a abertura da arquitetura não elimina as limitações de infraestrutura. O treinamento e a disponibilização de modelos modernos, independentemente da licença, ainda exigem enormes recursos computacionais e grandes quantidades de memória. Além disso, o desenvolvimento de modelos abertos com janelas de contexto maiores e a adição de multimodalidade apenas aumentam a necessidade de memória flexível e de alto desempenho, como a HBM.

Assim, a posição da Nvidia é que a diversidade e a variabilidade constante das cargas de trabalho de IA tornamVersatilidade e adaptabilidade são fatores econômicos essenciais. Aceleradores especializados, focados em tarefas específicas, podem apresentar resultados impressionantes em benchmarks, mas, no cenário de IA em rápida transformação, correm o risco de se tornarem obsoletos. A empresa está disposta a tolerar o alto custo do HBM e a complexidade de seus sistemas, pois isso lhe permite manter a capacidade de se adaptar a novas arquiteturas de modelos e cenários de implantação. Segundo Jensen Huang, o ponto em que os modelos se estabilizam a ponto de soluções especializadas serem mais econômicas do que plataformas flexíveis ainda não foi alcançado.

admin

Próximo As autoridades exigiram que as empresas chinesas cancelassem os pedidos de aceleradores Nvidia H200 americanos. »

Anterior « A OpenAI lançou a versão beta do ChatGPT Health para monitoramento de saúde.

Deixar comentário

Publicado por

admin

1 mês atrás

SSD de dados Nimbus de 100 TB com preço de $40,000

Postagens recentes

Jogos

O site oficial da Highguard está fora do ar há mais de um dia, mas não porque o estúdio esteja fechando.

Menos de um mês se passou desde o lançamento de Highguard, um jogo de tiro…

1 hora atrás

Jogos

O site oficial da Highguard está fora do ar há mais de um dia, mas não porque o estúdio esteja fechando.

Menos de um mês se passou desde o lançamento de Highguard, um jogo de tiro…

1 hora atrás

Programas

O Copilot está vasculhando os e-mails confidenciais dos usuários, burlando as medidas de segurança. A Microsoft chama isso de bug.

A Microsoft informou que um bug no Microsoft 365 Copilot tem feito com que seu…

2 horas atrás

Na vanguarda da ciência

Um buraco negro de massa intermediária, até então desconhecido, revelou-se ao despedaçar uma anã branca.

Em 2 de julho de 2025, o telescópio espacial de raios X Einstein Probe, da…

2 horas atrás

Inteligência Artificial, Aprendizado de Máquina, Redes Neurais

Com as melhores intenções: a Gemini mentiu sobre o armazenamento dos dados médicos do usuário para confortá-lo.

O aposentado americano Joe D. usou o modelo de IA Flash Gemini 3 do Google…

2 horas atrás

Telefones celulares, smartphones, comunicações celulares, comunicadores, PDAs

O Google apresentou o Pixel 10a, um smartphone de gama média com o design, as especificações e o preço do Pixel 9a.

O Google apresentou oficialmente seu smartphone de gama média, o Pixel 10a. O dispositivo é…

2 horas atrás

Jensen Huang explicou na CES 2026 por que a SRAM não substituirá a cara HBM em aceleradores de IA.

Conteúdo relacionado

Postagens recentes

O site oficial da Highguard está fora do ar há mais de um dia, mas não porque o estúdio esteja fechando.

O site oficial da Highguard está fora do ar há mais de um dia, mas não porque o estúdio esteja fechando.

O Copilot está vasculhando os e-mails confidenciais dos usuários, burlando as medidas de segurança. A Microsoft chama isso de bug.

Um buraco negro de massa intermediária, até então desconhecido, revelou-se ao despedaçar uma anã branca.

Com as melhores intenções: a Gemini mentiu sobre o armazenamento dos dados médicos do usuário para confortá-lo.

O Google apresentou o Pixel 10a, um smartphone de gama média com o design, as especificações e o preço do Pixel 9a.