Intel falou sobre o poder monstruoso dos gráficos carro-chefe Xe-HP em quatro cristais

Na conferência Hot Chips 2020, o arquiteto chefe e vice-presidente sênior da divisão de gráficos discretos da Intel, Raja Koduri, falou sobre o desempenho teórico dos futuros aceleradores da empresa. E os números anunciados são impressionantes.

Durante seu discurso, o Sr. Koduri tirou do bolso o maior e mais poderoso processador gráfico Xe HP, que combina quatro cristais em um substrato (haverá versões mais simples com um e dois cristais). Cada um deles inclui 512 unidades de computação (EU, unidades de execução) e, provavelmente, dois módulos de memória multicamadas HBM2e.

O líder então executou um benchmark para mostrar a excelente escalabilidade da arquitetura Xe e como o aumento do número de matrizes em um substrato se traduz em um múltiplo de escalonamento de desempenho. Trabalhando em um único cristal, o acelerador fornece até 10.588 teraflops de ponto flutuante FP32 com precisão simples. Quando dois cristais estão envolvidos, o desempenho escala quase perfeitamente para 21.161 teraflops (1.999x). A principal solução quad-die oferece 3,993x o aumento de desempenho para 41,908 teraflops.

A distribuição de tarefas entre GPUs em tecnologias como SLI e CrossFire é muito mais difícil, e o escalonamento de aceleradores adicionais geralmente dá aos jogadores um ganho na região de 50-80%, na melhor das hipóteses. No entanto, em cargas de trabalho de computação, as tarefas geralmente são independentes e podem ser dimensionadas perfeitamente. Portanto, em tarefas profissionais, a GPU carro-chefe da Intel com quatro cristais se mostrará claramente bem. E aqui está como as coisas serão na Intel com escalonamento gráfico – testes independentes irão mostrar.

Para comparação: a placa de vídeo GeForce RTX 2080 Ti em operações FP32 é capaz de fornecer até 14,2 teraflops de desempenho. Mas isso não é tudo: o Sr. Koduri também mencionou que o Xe HP baseado em quatro cristais é capaz de oferecer desempenho em petaflops. Em outras palavras, usando blocos tensores, a nova GPU da Intel será incrivelmente rápida em tarefas de aprendizado de máquina e inteligência artificial onde a alta precisão não é necessária.

avalanche

Postagens recentes

Os preços dos processadores Intel Arrow Lake Refresh subiram acima dos níveis recomendados 48 horas após o início das vendas.

No início deste mês, a Intel anunciou os processadores Arrow Lake Refresh, lançando o Core…

22 minutos atrás

O Telegram afirma que não há nenhuma vulnerabilidade perigosa no aplicativo de mensagens.

O serviço de imprensa do Telegram afirmou que a vulnerabilidade crítica no aplicativo, recentemente relatada,…

2 horas atrás

As ações dos fabricantes de DRAM se estabilizam após o impacto inicial do TurboQuant.

Esta semana, o Google apresentou o TurboQuant, seu método de compressão de dados para IA,…

4 horas atrás

O lucro anual da BYD caiu pela primeira vez em quatro anos, expondo os horrores da guerra de preços na China.

A empresa chinesa BYD alcançou a liderança no mercado global de veículos elétricos, apesar de…

5 horas atrás

O último dos cofundadores deixou a xAI, restando apenas Elon Musk.

Em termos de migração de talentos, o setor de IA é o mais movimentado do…

5 horas atrás

Os fabricantes chineses de chips pretendem atingir 80% de substituição de importações até 2030.

Para a indústria chinesa de semicondutores, a dependência de tecnologia e equipamentos importados continua sendo…

6 horas atrás