Pesquisadores chineses passaram da inferência para o treinamento de modelos de IA em aceleradores da Huawei.

A China anunciou o uso bem-sucedido de chips Huawei Ascend 910C para concluir o pós-treinamento do modelo DeepSeek-V4-Pro, marcando um avanço significativo para a indústria nacional de semicondutores, que busca ir além da inferência básica de IA para treinamentos mais complexos em meio ao endurecimento das sanções dos EUA, segundo o South China Morning Post.

Fonte da imagem: Igor Omilaev/unsplash.com

Após o sucesso no suporte à inferência de IA relativamente simples, os fabricantes de chips chineses encontraram dificuldades em dominar um processo de treinamento muito mais complexo.

Conforme relatado pelo governo de Shenzhen, como parte do projeto, uma equipe de pesquisa que inclui a Huawei Technologies lançou o maior modelo DeepSeek até o momento, com 1,6 trilhão de parâmetros, em um cluster de computação alimentado por pelo menos 1.000 chips da Huawei. Isso resultou em um pós-treinamento “totalmente paramétrico”, o que significa que toda a arquitetura do modelo foi atualizada e aprimorada sem concessões.

Enquanto anteriormente, a inferência usando poder computacional doméstico se assemelhava a “construir uma estrada de mão única para o modelo: inserir uma pergunta, obter uma resposta”, graças ao projeto, o modelo será capaz de autorreflexão e ajustes. Isso adicionou “cruzamentos e loops complexos a essa estrada de mão única, multiplicando instantaneamente as demandas de computação e comunicação”, observou o relatório.

Esta pesquisa, conduzida em conjunto pela Huawei, o Instituto da Rodovia Circular de Shenzhen, o Campus de Shenzhen do Instituto de Tecnologia de Harbin e o Instituto de Pesquisa de Big Data de Shenzhen, “ajudará a aumentar a autossuficiência da indústria de IA da China”, afirmou o governo de Shenzhen.

admin

Compartilhar
Publicado por
admin

Postagens recentes

A última conferência da Apple com Tim Cook, a WWDC 2026, começa na segunda-feira — o que esperar?

A conferência anual de desenvolvedores da Apple, a WWDC 2026, começa em 8 de junho,…

27 minutos atrás

O Linux não consegue manter a participação de 5% nas estatísticas do Steam.

Em março, a participação dos sistemas baseados em Linux atingiu um recorde de 5,33%, mas…

45 minutos atrás

A Nvidia ainda não revelou o preço dos PCs com chips RTX Spark, mas os parceiros da empresa já estão falando sobre o alto custo.

Na Computex 2026 em Taipei, a Nvidia apresentou seu primeiro processador para PCs voltado para…

45 minutos atrás

Uma fabricante chinesa de scooters apresentou um ekranoplano de dois lugares para entretenimento aquático.

A empresa chinesa Navee apresentou o WaveFly 5, uma aeronave de efeito solo biposto para…

45 minutos atrás

Os japoneses conseguiram cultivar nanotubos semicondutores de 1 nm — canais de transistores praticamente prontos para uso.

Pesquisadores japoneses relataram a criação de alguns dos nanotubos semicondutores mais finos do mundo. Trata-se…

1 hora atrás

Os Estados Unidos irão acelerar o desenvolvimento e a implementação da IA ​​para fins de segurança nacional.

Os Estados Unidos pretendem acelerar o desenvolvimento e a implementação de tecnologias de inteligência artificial…

3 horas atrás