Intel falou sobre o poder monstruoso dos gráficos carro-chefe Xe-HP em quatro cristais

Na conferência Hot Chips 2020, o arquiteto chefe e vice-presidente sênior da divisão de gráficos discretos da Intel, Raja Koduri, falou sobre o desempenho teórico dos futuros aceleradores da empresa. E os números anunciados são impressionantes.

Durante seu discurso, o Sr. Koduri tirou do bolso o maior e mais poderoso processador gráfico Xe HP, que combina quatro cristais em um substrato (haverá versões mais simples com um e dois cristais). Cada um deles inclui 512 unidades de computação (EU, unidades de execução) e, provavelmente, dois módulos de memória multicamadas HBM2e.

O líder então executou um benchmark para mostrar a excelente escalabilidade da arquitetura Xe e como o aumento do número de matrizes em um substrato se traduz em um múltiplo de escalonamento de desempenho. Trabalhando em um único cristal, o acelerador fornece até 10.588 teraflops de ponto flutuante FP32 com precisão simples. Quando dois cristais estão envolvidos, o desempenho escala quase perfeitamente para 21.161 teraflops (1.999x). A principal solução quad-die oferece 3,993x o aumento de desempenho para 41,908 teraflops.

A distribuição de tarefas entre GPUs em tecnologias como SLI e CrossFire é muito mais difícil, e o escalonamento de aceleradores adicionais geralmente dá aos jogadores um ganho na região de 50-80%, na melhor das hipóteses. No entanto, em cargas de trabalho de computação, as tarefas geralmente são independentes e podem ser dimensionadas perfeitamente. Portanto, em tarefas profissionais, a GPU carro-chefe da Intel com quatro cristais se mostrará claramente bem. E aqui está como as coisas serão na Intel com escalonamento gráfico – testes independentes irão mostrar.

Para comparação: a placa de vídeo GeForce RTX 2080 Ti em operações FP32 é capaz de fornecer até 14,2 teraflops de desempenho. Mas isso não é tudo: o Sr. Koduri também mencionou que o Xe HP baseado em quatro cristais é capaz de oferecer desempenho em petaflops. Em outras palavras, usando blocos tensores, a nova GPU da Intel será incrivelmente rápida em tarefas de aprendizado de máquina e inteligência artificial onde a alta precisão não é necessária.

avalanche

Postagens recentes

Conforme as cartas forem lançadas, conforme a rede ditar: a AWS está implementando uma arquitetura de rede RNG quase aleatória em seus data centers.

A AWS publicou uma descrição técnica da arquitetura de rede de data center que implementará…

22 horas atrás

O chefe da NASA afirma que os voos do foguete New Glenn não serão retomados antes de 2028, eliminando a Blue Origin da corrida lunar.

Durante um teste estático de ignição em 29 de maio de 2026, o foguete New…

22 horas atrás

Foi anunciado o sucessor espiritual de Zeus: Master of Olympus – o jogo de estratégia de construção de cidades Theos: Cities of Myth, onde história e mito se entrelaçam.

A editora Dotemu (Ninja Gaiden: Ragebound, Marvel Cosmic Invasion) e a Triskell Interactive, desenvolvedora de…

22 horas atrás

Plataforma de referência de IA Qualcomm Dragonwing IQ10 para robótica é apresentada.

Cristiano Amon, CEO da Qualcomm, apresentou a plataforma robótica Dragonwing IQ10 atualizada na Computex 2026.…

23 horas atrás

O RPG infernal baseado em turnos, Entropy, do criador de Dread Delusion, recebeu uma demo e uma data de lançamento no Acesso Antecipado do Steam.

A editora DreadXP e o estúdio britânico Lovely Hellplace (Dread Delusion) anunciaram a data de…

23 horas atrás