Exaflops em uma encruzilhada: o atraso da Intel em dominar novos processos tecnológicos pode afetar o tempo de lançamento do supercomputador Aurora

O principal tópico de discussão na mídia no relatório de sexta-feira da Intel sobre o estado das coisas no segundo trimestre foi o reconhecimento dos problemas com o desenvolvimento da tecnologia de processo de 7 nm e os atrasos relacionados no lançamento de produtos baseados nela, que podem variar de 6 a 12 meses. E um desses produtos é o acelerador Ponte Vecchio, que se tornará um componente essencial do supercomputador Aurora.

No entanto, esta máquina, criada para o Laboratório Nacional de Argonne, tem um destino difícil. O supercomputador Aurora foi anunciado originalmente em 2015. O projeto anterior envolvia a construção de uma máquina de 180 Pflops pela Intel e Cray, que deveria funcionar em 2018. O principal deles era o chips Xeon Phi de 10 nm da família Knights Hill (KNH), cujo lançamento estava previsto para o mesmo 2018. Como sabemos agora, a empresa não conseguiu produzir o desenvolvimento oportuno de 10 nm ou os aceleradores KNH. Além disso, o desenvolvimento de Xeon Phi foi finalmente interrompido e o lote final da última geração de Knights Mill será enviado no final de julho. O mesmo destino aconteceu com a interconexão Omni-Path (OPA) anunciada em conjunto com a KNH.

No final de 2017, houve três eventos importantes para o Aurora de uma só vez. Primeiro, o projeto do supercomputador foi completamente redesenhado – o lançamento foi adiado para 2021 e o desempenho planejado subiu para a marca de 1 Eflops. Conforme concebido, o Aurora deveria se tornar o melhor e mais produtivo supercomputador dos Estados Unidos, se não do mundo. Em vez de Xeon Phi, e isso é em segundo lugar, foi planejado o uso dos aceleradores da próxima geração, agora conhecidos como Intel Xe Ponte Vecchio. Terceiro, Raja Koduri se juntou à Intel para liderar a equipe discreta de desenvolvimento de GPU.

Apresentação de Aurora antiga

Uma maneira óbvia de sair dessa situação é recorrer a fábricas de terceiros que já dominam os padrões necessários. Antes de tudo, estamos falando, é claro, sobre o TSMC, que serve à AMD e à NVIDIA. A Intel supostamente fez um pedido ao TSMC para 180.000 bolachas de 6nm (mas não 5nm conforme o esperado). A Intel anteriormente usava o TSMC principalmente para produzir chipsets e SoCs relativamente simples e baratos, além de FPGAs. Para comparação, o volume de pedidos da AMD é de 200 mil placas. Não se diz exatamente exatamente quais produtos e componentes serão produzidos, embora durante o relatório trimestral a Intel tenha mencionado cristais diferentes em Ponte Vecchio, alguns dos quais poderiam realmente ser dados a terceiros.

A arquitetura da Ponte Vecchio é verdadeiramente modular e pressupõe a seleção das unidades de computação necessárias, dependendo da tarefa e da finalidade do dispositivo. Ao mesmo tempo, não está completamente claro se um layout com vários chips é destinado a esses blocos ou não. Na apresentação do ano passado do Intel Xe HPC, que será instalado no Aurora, foi claramente falado apenas sobre como conectar a memória HBM2 via EMIB, bem como embalar o Foveros para formar o Rambo Cache, um cache do barramento XE Memory Fabric comum que combina CPU, GPU e memória.

Comentando o interior do HPC, o analista da Hyperion Research, Steve Conway, observa que “o lançamento do Aurora pode ser adiado para o final de 2021 ou o início de 2022. Não há muito atraso, mas ainda é um atraso. Os problemas com o processo técnico dizem respeito não apenas à GPU, mas em geral a todos os componentes de 7 nm. ” Conway diz que a Intel provavelmente terceirizará parte de sua produção, mas apenas no período inicial. Note-se que o segmento de servidores é importante para a Intel.

New Aurora

De qualquer forma, essa situação pode ter um efeito positivo na AMD. Segundo o analista, o atual AMD EPYC de 7 nm é bom em termos de largura de banda de memória e o preço desses processadores geralmente é mais baixo. A combinação desses dois fatores promove o crescimento. Atualmente, dois supercomputadores estão sendo desenvolvidos com base nas soluções AMD (CPU + GPU): El Capitan com capacidade de mais de 2 Eflops, com previsão de comissionamento em 2023, e Frontier com capacidade de 1,5 Eflops, a ser lançado no próximo ano. Assim como o Aurora, os dois projetos são contratados pela Cray (agora HPE).

avalanche

Postagens recentes

Um construtor em vez de um monólito: NVIDIA deu mais liberdade na customização do GB300 NVL72

Para os novos superaceleradores (G)B300, a NVIDIA mudou significativamente a cadeia de suprimentos, tornando-a mais…

25 minutos atrás

A Microsoft criou “componentes verdes” – os componentes do servidor desativados terão uma segunda vida para o bem do meio ambiente

O rápido desenvolvimento da indústria de inteligência artificial tornou relevantes as discussões sobre o alto…

2 horas atrás

Dataminer: Valve iniciou testes ativos de Half-Life 3 e poderá anunciar o jogo em breve

O dataminer Maxim Poletaev, conhecido pelo pseudônimo de Gabe Follower, compartilhou suas descobertas em um…

5 horas atrás

Vários países estão testando o abandono dos passaportes em papel em favor de uma identificação digital em um smartphone

Nos próximos anos, os passaportes tradicionais em papel poderão tornar-se uma relíquia do passado. Serão…

17 horas atrás