Aceleradores de IA desenvolvidos na China, utilizando chiplets lógicos baseados em um processo de 14 nm e memória DRAM baseada em um processo de 18 nm, são capazes de competir com os chips Nvidia Blackwell fabricados com o processo de 4 nm da TSMC. Essa opinião foi expressa por Wei Shaojun, vice-presidente da Associação da Indústria de Semicondutores da China e professor da Universidade Tsinghua, em um evento do setor, segundo o DigiTimes.
Fonte da imagem: AMD
Em seu discurso na Cúpula Global de CEOs da ICC, Wei Shaojun observou que a chave para um avanço em desempenho e eficiência seria a avançada tecnologia de empilhamento 3D usada na criação de aceleradores chineses.
Wei Shaojun, que anteriormente afirmou que as metas do programa “Made in China 2025” da China eram inatingíveis e posteriormente pediu ao país que abandonasse aceleradores de IA estrangeiros, como o Nvidia H2O, e adotasse soluções nacionais, descreveu uma hipotética “solução nacional totalmente controlada” que combinaria lógica de 14 nm com DRAM de 18 nm usando ligação híbrida 3D. Ele não apresentou nenhuma evidência de desenvolvimento ou mesmo confirmação da viabilidade de implementar tal solução usando as tecnologias existentes na China.
Segundo Wei, essa configuração foi projetada para se aproximar do desempenho das GPUs de 4 nm da Nvidia, apesar de usar tecnologia legada. Ele acredita que essa solução poderia oferecer 120 teraflops de desempenho. Ele também afirmou que o consumo de energia seria de apenas cerca de 60 watts, o que, segundo Wei, proporcionaria um desempenho superior (2 teraflops por watt) ao dos processadores Intel Xeon. Para efeito de comparação, o acelerador Nvidia B200 oferece 10.000 teraflops NVFP4 de desempenho, consumindo 1.200 watts, ou 8,33 teraflops NVFP4 por watt. O Nvidia B300 oferece 10,7 teraflops NVFP4 por watt, o que representa cinco vezes o desempenho do acelerador de IA mencionado por Wei.
Tecnologias-chave projetadasA tecnologia de ligação híbrida 3D (cobre sobre cobre e ligação por óxido), que substitui as esferas de solda por conexões diretas de cobre com um espaçamento inferior a 10 µm e permite computação em nível próximo ao da RAM, é fundamental para impulsionar significativamente o desempenho do acelerador de IA que está sendo desenvolvido na China. A ligação híbrida com um espaçamento inferior a 10 µm possibilita a criação de dezenas a centenas de milhares de conexões verticais por mm², bem como caminhos de sinal em escala micrométrica para conexões de alta velocidade e baixa latência.
Um dos melhores exemplos de tecnologia de ligação híbrida 3D é o 3D V-Cache da AMD, que oferece uma taxa de transferência de 2,5 TB/s com um consumo de energia de E/S de 0,05 pJ/bit. Wei provavelmente almeja um valor semelhante para seu projeto. 2,5 TB/s por dispositivo é significativamente superior à largura de banda da memória HBM3E, portanto, isso pode representar um avanço para aceleradores de IA baseados no conceito de computação próxima à memória. Wei também observou que esse conceito poderia, teoricamente, ser escalado para zettaflops de desempenho, embora não tenha especificado quando ou como tais números seriam alcançados.
Wei identificou a plataforma CUDA da Nvidia como um risco fundamental não apenas para a alternativa que descreveu, mas também para plataformas de hardware que não sejam da Nvidia, visto que, uma vez que software, modelos e hardware são combinados em uma única plataforma proprietária, torna-se difícil implantar processadores alternativos. Dado que ele considerava a computação próxima à memória como uma forma de melhorar significativamente a competitividade do hardware paraPara IA desenvolvida na China, qualquer plataforma alternativa que não seja baseada nesse conceito (incluindo aceleradores de IA chineses como a série Huawei Ascend ou GPUs Biren) pode ser considerada incompatível.
Libertar-se dos pacotes Microsoft Office é mais difícil do que parece. A empresa francesa Airbus…
O estúdio polonês Techland anunciou o lançamento da sua maior atualização de conteúdo desde o…
O jogo de tiro tático online da Ubisoft, Tom Clancy's Rainbow Six Siege, está se…
Menos de três meses após o anúncio do iPhone Air, o público se convenceu de…
O tão falado remake do jogo de ação pirata em mundo aberto Assassin's Creed IV:…
De acordo com um relatório da HSBC Global Investment Research, a OpenAI precisa de US$…