odm2zjcyymu3n2i3n2mxzwe2mtdkn2e2yjhlyjewzwq1yzqyotgwndhinjdlyza2m2uwyzc5yjk3odazm2fiyq-4685820

Na conferência Hot Chips 2020, o arquiteto chefe e vice-presidente sênior da divisão de gráficos discretos da Intel, Raja Koduri, falou sobre o desempenho teórico dos futuros aceleradores da empresa. E os números anunciados são impressionantes.

Durante seu discurso, o Sr. Koduri tirou do bolso o maior e mais poderoso processador gráfico Xe HP, que combina quatro cristais em um substrato (haverá versões mais simples com um e dois cristais). Cada um deles inclui 512 unidades de computação (EU, unidades de execução) e, provavelmente, dois módulos de memória multicamadas HBM2e.

zmqwyzzmyjdhowrmmdgxzguznzrjztq1odi2m2q2nwjhyzexyjdhotdknge2ogiwn2iyngy0mdk2n2vhztuxmasm-03-750-1987638

O líder então executou um benchmark para mostrar a excelente escalabilidade da arquitetura Xe e como o aumento do número de matrizes em um substrato se traduz em um múltiplo de escalonamento de desempenho. Trabalhando em um único cristal, o acelerador fornece até 10.588 teraflops de ponto flutuante FP32 com precisão simples. Quando dois cristais estão envolvidos, o desempenho escala quase perfeitamente para 21.161 teraflops (1.999x). A principal solução quad-die oferece 3,993x o aumento de desempenho para 41,908 teraflops.

zdbknwm5mzhlnjzimmu3zmjjmzy2ywzmymuxzgjmnwnlndy3zji5zmnlndbkmwu3nti0mgqymgvhmje0ntjlngsm-02-750-8047182

A distribuição de tarefas entre GPUs em tecnologias como SLI e CrossFire é muito mais difícil, e o escalonamento de aceleradores adicionais geralmente dá aos jogadores um ganho na região de 50-80%, na melhor das hipóteses. No entanto, em cargas de trabalho de computação, as tarefas geralmente são independentes e podem ser dimensionadas perfeitamente. Portanto, em tarefas profissionais, a GPU carro-chefe da Intel com quatro cristais se mostrará claramente bem. E aqui está como as coisas serão na Intel com escalonamento gráfico – testes independentes irão mostrar.

Para comparação: a placa de vídeo GeForce RTX 2080 Ti em operações FP32 é capaz de fornecer até 14,2 teraflops de desempenho. Mas isso não é tudo: o Sr. Koduri também mencionou que o Xe HP baseado em quatro cristais é capaz de oferecer desempenho em petaflops. Em outras palavras, usando blocos tensores, a nova GPU da Intel será incrivelmente rápida em tarefas de aprendizado de máquina e inteligência artificial onde a alta precisão não é necessária.

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *