Por um lado, os problemas com o fornecimento dos mais recentes aceleradores de computação da Nvidia para a China estão forçando os desenvolvedores locais a se concentrarem em alternativas de origem chinesa. Por outro lado, se o custo de migração de software para uma plataforma chinesa for muito alto, os especialistas aconselham manter o compromisso com a base de componentes da Nvidia.
Em qualquer caso, recomendações semelhantes são dadas aos operadores de centros de dados chineses por especialistas da CAICT, a Academia Chinesa de Tecnologia da Informação e Telecomunicações, conforme relatado pelo South China Morning Post. “Se as condições permitirem, os data centers devem escolher os aceleradores A100 e H100 de alto desempenho. Se a necessidade de recursos computacionais for limitada, você pode optar por alternativas H20 ou chinesas”, recomendam literalmente os especialistas.
O problema não é tão simples, uma vez que as sanções ocidentais impedem que os operadores de centros de dados chineses comprem aceleradores Nvidia de alto desempenho, e os H20 “legalizados” podem ser inferiores às alternativas chinesas. Mas mesmo neste caso, às vezes é melhor que os desenvolvedores permaneçam na plataforma Nvidia em vez de lidar com o longo e caro processo de migração de suas soluções de software para aceleradores de origem chinesa. Os especialistas da CAICT não escondem o facto de que as sanções dos EUA nos últimos três anos contribuíram para o desenvolvimento activo dos desenvolvedores chineses de software e hardware. E, no entanto, a migração de modelos de linguagem treinados em soluções Nvidia para plataformas chinesas exige custos significativos e, portanto, nem sempre parece racional.
Até agosto de 2022, a Nvidia manteve o direito de fornecer aceleradores A100 e H100 à China, mas as sanções impostas posteriormente forçaram-na a providenciar rapidamente o fornecimento de aceleradores A800 e H800 modificados para levar em conta as restrições americanas, que poderiam ser entregues até outubro do ano passado. Depois disso, eles também foram alvo de sanções, e como resultado a Nvidia teve que desenvolver aceleradores H20, L20 e L2 para o mercado chinês.
No final do ano passado, o desempenho total dos data centers que operam na China aumentou 27%, para 230 exaflops. Na área de inteligência artificial, o poder da computação chinesa cresceu muito mais rápido, 70% ano a ano. Em Junho deste ano, mais de 250 centros informáticos com acesso à Internet estavam em construção ou já tinham sido inaugurados na China. Nem todos podiam orgulhar-se de uma localização favorável, pois estavam distantes dos principais centros de desenvolvimento tecnológico. A indústria chinesa poderá sofrer não só com o excesso de poder computacional, mas também com os baixos níveis de capacidade computacional, bem como com a qualidade medíocre dos dados processados. As GPUs na China, de acordo com o CAICT, são em média apenas 40% carregadas com cálculos, e os data centers existentes sofrem com um fraco equilíbrio de recursos, o que também reduz a sua eficiência. A integração mútua de clusters é complicada pela necessidade de utilizar equipamentos e software heterogêneos de diferentes fornecedores.