Intel falou sobre o poder monstruoso dos gráficos carro-chefe Xe-HP em quatro cristais

Na conferência Hot Chips 2020, o arquiteto chefe e vice-presidente sênior da divisão de gráficos discretos da Intel, Raja Koduri, falou sobre o desempenho teórico dos futuros aceleradores da empresa. E os números anunciados são impressionantes.

Durante seu discurso, o Sr. Koduri tirou do bolso o maior e mais poderoso processador gráfico Xe HP, que combina quatro cristais em um substrato (haverá versões mais simples com um e dois cristais). Cada um deles inclui 512 unidades de computação (EU, unidades de execução) e, provavelmente, dois módulos de memória multicamadas HBM2e.

O líder então executou um benchmark para mostrar a excelente escalabilidade da arquitetura Xe e como o aumento do número de matrizes em um substrato se traduz em um múltiplo de escalonamento de desempenho. Trabalhando em um único cristal, o acelerador fornece até 10.588 teraflops de ponto flutuante FP32 com precisão simples. Quando dois cristais estão envolvidos, o desempenho escala quase perfeitamente para 21.161 teraflops (1.999x). A principal solução quad-die oferece 3,993x o aumento de desempenho para 41,908 teraflops.

A distribuição de tarefas entre GPUs em tecnologias como SLI e CrossFire é muito mais difícil, e o escalonamento de aceleradores adicionais geralmente dá aos jogadores um ganho na região de 50-80%, na melhor das hipóteses. No entanto, em cargas de trabalho de computação, as tarefas geralmente são independentes e podem ser dimensionadas perfeitamente. Portanto, em tarefas profissionais, a GPU carro-chefe da Intel com quatro cristais se mostrará claramente bem. E aqui está como as coisas serão na Intel com escalonamento gráfico – testes independentes irão mostrar.

Para comparação: a placa de vídeo GeForce RTX 2080 Ti em operações FP32 é capaz de fornecer até 14,2 teraflops de desempenho. Mas isso não é tudo: o Sr. Koduri também mencionou que o Xe HP baseado em quatro cristais é capaz de oferecer desempenho em petaflops. Em outras palavras, usando blocos tensores, a nova GPU da Intel será incrivelmente rápida em tarefas de aprendizado de máquina e inteligência artificial onde a alta precisão não é necessária.

avalanche

Postagens recentes

Barcos movidos a hidrogênio fornecerão energia aos centros de dados de IA de Singapura.

Os centros de dados enfrentam uma crescente escassez de energia elétrica e espaço disponível. A…

28 minutos atrás

A próxima conferência Microsoft Build será realizada nos dias 2 e 3 de junho em São Francisco.

A Microsoft está transferindo sua conferência anual para desenvolvedores, a Build, de Seattle de volta…

2 horas atrás

A Meta pagará à News Corp pelo acesso do seu bot de IA ao conteúdo de notícias.

A Meta✴Platforms firmou um acordo de licenciamento de inteligência artificial com a News Corp. Segundo…

2 horas atrás

A Accenture tornou-se a nova proprietária da Downdetector e da Speedtest em um negócio avaliado em mais de US$ 1 bilhão.

A Ziff Davis anunciou a venda de sua divisão de Conectividade, que inclui o serviço…

2 horas atrás