Intel falou sobre o poder monstruoso dos gráficos carro-chefe Xe-HP em quatro cristais

Na conferência Hot Chips 2020, o arquiteto chefe e vice-presidente sênior da divisão de gráficos discretos da Intel, Raja Koduri, falou sobre o desempenho teórico dos futuros aceleradores da empresa. E os números anunciados são impressionantes.

Durante seu discurso, o Sr. Koduri tirou do bolso o maior e mais poderoso processador gráfico Xe HP, que combina quatro cristais em um substrato (haverá versões mais simples com um e dois cristais). Cada um deles inclui 512 unidades de computação (EU, unidades de execução) e, provavelmente, dois módulos de memória multicamadas HBM2e.

O líder então executou um benchmark para mostrar a excelente escalabilidade da arquitetura Xe e como o aumento do número de matrizes em um substrato se traduz em um múltiplo de escalonamento de desempenho. Trabalhando em um único cristal, o acelerador fornece até 10.588 teraflops de ponto flutuante FP32 com precisão simples. Quando dois cristais estão envolvidos, o desempenho escala quase perfeitamente para 21.161 teraflops (1.999x). A principal solução quad-die oferece 3,993x o aumento de desempenho para 41,908 teraflops.

A distribuição de tarefas entre GPUs em tecnologias como SLI e CrossFire é muito mais difícil, e o escalonamento de aceleradores adicionais geralmente dá aos jogadores um ganho na região de 50-80%, na melhor das hipóteses. No entanto, em cargas de trabalho de computação, as tarefas geralmente são independentes e podem ser dimensionadas perfeitamente. Portanto, em tarefas profissionais, a GPU carro-chefe da Intel com quatro cristais se mostrará claramente bem. E aqui está como as coisas serão na Intel com escalonamento gráfico – testes independentes irão mostrar.

Para comparação: a placa de vídeo GeForce RTX 2080 Ti em operações FP32 é capaz de fornecer até 14,2 teraflops de desempenho. Mas isso não é tudo: o Sr. Koduri também mencionou que o Xe HP baseado em quatro cristais é capaz de oferecer desempenho em petaflops. Em outras palavras, usando blocos tensores, a nova GPU da Intel será incrivelmente rápida em tarefas de aprendizado de máquina e inteligência artificial onde a alta precisão não é necessária.

avalanche

Postagens recentes

O Telegram para Android passou por uma reformulação radical no estilo do Liquid Glass.

Na noite passada, foi lançado o Telegram 12.4 para Android, um cliente completamente redesenhado com…

38 minutos atrás

A SpaceX recebeu autorização para retomar os lançamentos do Falcon 9 após o acidente – o voo para a ISS está agendado para 11 de fevereiro.

A SpaceX e a NASA receberam autorização oficial da Administração Federal de Aviação (FAA) para…

38 minutos atrás

As ações das grandes empresas de tecnologia dos EUA voltaram a crescer após três dias de queda.

Após uma série de anúncios dos maiores provedores de serviços em nuvem dos EUA sobre…

1 hora atrás

A Nintendo prevê que o aumento dos preços da memória terá pouco impacto em seus negócios até o final de março.

Os consoles de videogame não ficaram imunes ao impacto do aumento dos preços dos chips…

1 hora atrás

A Broadcom apresenta as primeiras soluções Wi-Fi 8 do setor para pontos de acesso e switches de nível empresarial.

A Broadcom anunciou o BCM49438 e o Trident X3+ BCM56390. Esses componentes são considerados as…

3 horas atrás