Segundo a Reuters, a prática global no desenvolvimento de grandes modelos de linguagem envolve uma etapa final na qual eles são otimizados por fornecedores de aceleradores computacionais antes de serem lançados no mercado. A DeepSeek escolheu a Huawei e outros fornecedores chineses de aceleradores para aprimorar seu modelo de IA mais recente.

Fonte da imagem: Nvidia

A questão é, como explica a Reuters, que tradicionalmente, o “direito de casamento” era concedido aos principais fornecedores americanos de aceleradores, nomeadamente a Nvidia. Os modelos de IA da DeepSeek seguiam essa regra anteriormente, mas com a versão mais recente, a V4, os desenvolvedores chineses deram preferência a compatriotas como a Huawei e outros fornecedores chineses de aceleradores. Algumas semanas antes do lançamento do novo modelo de IA, a DeepSeek abriu o acesso a fornecedores chineses de aceleradores. Isso permitirá que o software seja otimizado para as especificidades da base de hardware em questão e, consequentemente, alcance um desempenho superior do modelo.

De acordo com desenvolvedores independentes, as ferramentas modernas de otimização permitem que esse trabalho seja concluído em questão de semanas, em comparação com os vários meses necessários anteriormente. Aparentemente, essa priorização no caso da DeepSeek faz parte de uma política implementada pelo governo chinês. Hardware e software produzidos localmente devem ter prioridade sobre os americanos. No entanto, essa notícia contradiz relatos anteriores de que a DeepSeek está usando um centro de dados secreto com aceleradores Nvidia Blackwell para treinar seu modelo de IA mais recente. Autoridades americanas acreditam que a DeepSeek tentará ocultar o uso de aceleradores da Blackwell em preparação para o lançamento do novo modelo, ao mesmo tempo que alega usar aceleradores da Huawei.

admin

Compartilhar
Publicado por
admin

Postagens recentes

Ryzen e Dual-Rank DDR5: Testando o kit G.Skill Trident Z5 Royal DDR5-6400 CL32 de 64 GB / Processadores e Memória

Nos últimos dois anos, a memória RAM passou de um componente secundário para um dos…

5 horas atrás

Jornalistas revelaram a dimensão das futuras demissões na Xbox – até mesmo a Arkane Studios e seu jogo Marvel’s Blade correm o risco de fechar as portas.

O The Verge, citando fontes familiarizadas com os planos da Microsoft, noticiou mais uma possível…

8 horas atrás

Inteligência artificial foi treinada para falar como um homem das cavernas para economizar milhões em tokens.

Desenvolvedores de chatbots começaram a usar amplamente uma ferramenta especializada chamada Caveman, que força a…

8 horas atrás