AMD demonstra acelerador de computação MI300X, que supera a solução da NVIDIA em suporte de memória

Nesta terça-feira, a chefe da AMD Lisa Su (Lisa Su) em um evento especial previsivelmente demonstrou uma amostra do acelerador de computação MI300X, que começará a ser entregue aos clientes antes do final deste ano. Em comparação com a solução concorrente NVIDIA H100, ela oferece suporte para até 192 GB de memória versus 120 GB, respectivamente.

“Fonte da imagem: Getty Images, David Becker”

Durante a demonstração das capacidades dos aceleradores baseados no MI300X, foi mostrada sua capacidade de trabalhar com um modelo de linguagem para inteligência artificial contendo 40 bilhões de parâmetros. Para efeito de comparação, a conhecida startup GPT-3 OpenAI possui 175 bilhões de parâmetros. Como explicou Lisa Su, os modelos de linguagem tornam-se significativamente maiores por esse critério, portanto, os desenvolvedores precisarão de várias GPUs ao mesmo tempo para trabalhar com um modelo. É verdade que, devido ao suporte para mais memória, o AMD MI300X é capaz de reduzir a necessidade de aceleradores adicionais.

O suporte para a Arquitetura Infinity permite que os clientes da AMD combinem até oito aceleradores MI300X em um sistema. As soluções concorrentes da NVIDIA contam com o ecossistema de software CUDA para desenvolver aplicativos que formam o sistema de IA, enquanto a AMD conta com a plataforma ROCm, que funciona com um ecossistema aberto de modelos. Arquitetonicamente, o MI300X é baseado nos núcleos de arquitetura Zen 4 e CDNA 3, complementando-os com até oito pilhas de memória HBM3. O número total de transistores em um substrato do acelerador MI300X chega a 153 bilhões de peças. A solução AMD também supera o produto NVIDIA em termos de largura de banda de memória, que chega a 5,2 TB / s, e a interface Infinity Fabric transfere até 896 GB de informações por segundo.

avalanche

Postagens recentes

Os robôs aprenderam a copiar habilidades humanas simplesmente observando as pessoas.

Os seres humanos podem aprender ações específicas com outros seres humanos e, em alguns casos,…

41 minutos atrás

A vulnerabilidade Fabricked quebra secretamente o hardware do chip EPYC com 100% de sucesso — a AMD já lançou uma correção.

Em abril, pesquisadores da ETH Zurich descobriram uma vulnerabilidade de software que compromete silenciosamente a…

41 minutos atrás

A Perplexity reduziu os limites de alguns usuários devido ao uso indevido de códigos promocionais.

Ao longo da última semana, usuários do Perplexity começaram a reclamar que estavam excedendo seus…

41 minutos atrás

O smartphone de Trump é real – jornalistas receberam o primeiro T1 Phone para análise.

A Trump Mobile começou a fornecer amostras do T1 Phone para veículos de mídia selecionados…

2 horas atrás

A RTK-DC apresentou a solução modular “Ark” para garantir total segurança de dados.

A RTK-DC anunciou o "Ark", uma solução modular de hardware e software para armazenamento seguro…

3 horas atrás