Segundo a Reuters, a prática global no desenvolvimento de grandes modelos de linguagem envolve uma etapa final na qual eles são otimizados por fornecedores de aceleradores computacionais antes de serem lançados no mercado. A DeepSeek escolheu a Huawei e outros fornecedores chineses de aceleradores para aprimorar seu modelo de IA mais recente.

Fonte da imagem: Nvidia

A questão é, como explica a Reuters, que tradicionalmente, o “direito de casamento” era concedido aos principais fornecedores americanos de aceleradores, nomeadamente a Nvidia. Os modelos de IA da DeepSeek seguiam essa regra anteriormente, mas com a versão mais recente, a V4, os desenvolvedores chineses deram preferência a compatriotas como a Huawei e outros fornecedores chineses de aceleradores. Algumas semanas antes do lançamento do novo modelo de IA, a DeepSeek abriu o acesso a fornecedores chineses de aceleradores. Isso permitirá que o software seja otimizado para as especificidades da base de hardware em questão e, consequentemente, alcance um desempenho superior do modelo.

De acordo com desenvolvedores independentes, as ferramentas modernas de otimização permitem que esse trabalho seja concluído em questão de semanas, em comparação com os vários meses necessários anteriormente. Aparentemente, essa priorização no caso da DeepSeek faz parte de uma política implementada pelo governo chinês. Hardware e software produzidos localmente devem ter prioridade sobre os americanos. No entanto, essa notícia contradiz relatos anteriores de que a DeepSeek está usando um centro de dados secreto com aceleradores Nvidia Blackwell para treinar seu modelo de IA mais recente. Autoridades americanas acreditam que a DeepSeek tentará ocultar o uso de aceleradores da Blackwell em preparação para o lançamento do novo modelo, ao mesmo tempo que alega usar aceleradores da Huawei.

admin

Compartilhar
Publicado por
admin

Postagens recentes

Hackers vazaram dados de clientes da Trump Mobile e revelaram as vendas reais do smartphone T1.

Antes do lançamento do infame smartphone Trump Mobile T1, começaram a surgir relatos de vazamentos…

48 minutos atrás

“Sua opinião importa”: os desenvolvedores de Subnautica 2 ajudarão os jogadores a se defenderem dos peixes, mas não adicionarão armas.

Os desenvolvedores do estúdio americano Unknown Worlds Entertainment (de propriedade da Krafton) publicaram uma carta…

2 horas atrás

A Owlcat revelou as estatísticas dos participantes do beta de The Expanse: Osiris Reborn e explicou como irá melhorar o jogo após as críticas dos fãs.

Os desenvolvedores da Owlcat Games resumiram o primeiro mês de testes beta fechados do RPG…

2 horas atrás

A AMD está preparando um mini PC Ryzen AI Halo para programação sem nuvem, com preço de US$ 3.999.

A AMD está prestes a apresentar a estação de trabalho compacta Ryzen AI Halo, com…

2 horas atrás