Jensen Huang explicou na CES 2026 por que a SRAM não substituirá a cara HBM em aceleradores de IA.

O CEO da Nvidia, Jensen Huang, explicou por que a SRAM não substituirá a memória de alta largura de banda (HBM) em sistemas de IA. Em uma sessão de perguntas e respostas na CES 2026 em Las Vegas, ele respondeu às especulações de que a empresa poderia abandonar a cara HBM em favor de componentes mais baratos.

Fonte da imagem: Tom’s Hardware

De acordo com o Tom’s Hardware, Huang delineou uma visão de que o requisito fundamental para hardware de IA não é a especialização restrita, mas sim a flexibilidade, que é precisamente o que a memória HBM proporciona. Seu principal argumento centra-se na natureza instável e em constante mudança das cargas de trabalho de IA. Os modelos evoluem rapidamente e novas arquiteturas e modalidades são introduzidas, tornando a otimização de hardware para uma única tarefa ineficaz a longo prazo. Embora Huang tenha reconhecido que as soluções centradas em SRAM podem oferecer velocidade incrível em certos cenários e evitar a latência inerente à memória externa, elas enfrentam severas limitações de capacidade ao serem escaladas. Embora tais aceleradores pareçam atraentes em testes controlados, em aplicações do mundo real eles não conseguem oferecer o equilíbrio entre largura de banda e densidade que a HBM proporciona.

O CEO da Nvidia também abordou o tema dos modelos de IA abertos, cuja proliferação deverá reduzir a dependência de GPUs caras. Ele reconheceu o valor desses modelos, mas enfatizou que a abertura da arquitetura não elimina as limitações de infraestrutura. O treinamento e a disponibilização de modelos modernos, independentemente da licença, ainda exigem enormes recursos computacionais e grandes quantidades de memória. Além disso, o desenvolvimento de modelos abertos com janelas de contexto maiores e a adição de multimodalidade apenas aumentam a necessidade de memória flexível e de alto desempenho, como a HBM.

Assim, a posição da Nvidia é que a diversidade e a variabilidade constante das cargas de trabalho de IA tornamVersatilidade e adaptabilidade são fatores econômicos essenciais. Aceleradores especializados, focados em tarefas específicas, podem apresentar resultados impressionantes em benchmarks, mas, no cenário de IA em rápida transformação, correm o risco de se tornarem obsoletos. A empresa está disposta a tolerar o alto custo do HBM e a complexidade de seus sistemas, pois isso lhe permite manter a capacidade de se adaptar a novas arquiteturas de modelos e cenários de implantação. Segundo Jensen Huang, o ponto em que os modelos se estabilizam a ponto de soluções especializadas serem mais econômicas do que plataformas flexíveis ainda não foi alcançado.

admin

Compartilhar
Publicado por
admin

Postagens recentes

A Meta aumentou sua receita publicitária e sua audiência, com suas ações subindo 10%.

No quarto trimestre do ano passado, a receita da Meta✴Platforms, fundada por Mark Zuckerberg, cresceu…

2 horas atrás

É preciso dois sobre rodas: anunciada a aventura cooperativa da WheelMates sobre carros de controle remoto.

O gênero de aventura cooperativa para dois jogadores está vivo e forte, graças não apenas…

3 horas atrás

As expansões de história de Vampire: The Masquerade – Bloodlines 2 podem chegar antes do prometido – a Paradox revelou seu plano de desenvolvimento para 2026.

A editora Paradox Interactive e os desenvolvedores do estúdio britânico The Chinese Room revelaram um…

3 horas atrás

O Spotify pagou US$ 11 bilhões a músicos em 2025, um novo recorde.

O Spotify, proprietário do serviço de streaming de música de mesmo nome, anunciou que pagará…

4 horas atrás

A Samsung confirmou que lançará seus primeiros óculos de realidade aumentada ainda este ano.

Na conferência de resultados trimestrais, o vice-presidente da Samsung Electronics, Seong Cho, confirmou o compromisso…

4 horas atrás

O Abismo Sem Fundo do Metaverso: Prejuízos da Meta Reality Labs Chegam a US$ 80 Bilhões em Cinco Anos, Mas Zuckerberg Não Desiste.

O trabalho da Meta✴ na criação do metaverso continua a ser dispendioso. Durante a divulgação…

4 horas atrás