Segundo a Reuters, a prática global no desenvolvimento de grandes modelos de linguagem envolve uma etapa final na qual eles são otimizados por fornecedores de aceleradores computacionais antes de serem lançados no mercado. A DeepSeek escolheu a Huawei e outros fornecedores chineses de aceleradores para aprimorar seu modelo de IA mais recente.
Fonte da imagem: Nvidia
A questão é, como explica a Reuters, que tradicionalmente, o “direito de casamento” era concedido aos principais fornecedores americanos de aceleradores, nomeadamente a Nvidia. Os modelos de IA da DeepSeek seguiam essa regra anteriormente, mas com a versão mais recente, a V4, os desenvolvedores chineses deram preferência a compatriotas como a Huawei e outros fornecedores chineses de aceleradores. Algumas semanas antes do lançamento do novo modelo de IA, a DeepSeek abriu o acesso a fornecedores chineses de aceleradores. Isso permitirá que o software seja otimizado para as especificidades da base de hardware em questão e, consequentemente, alcance um desempenho superior do modelo.
De acordo com desenvolvedores independentes, as ferramentas modernas de otimização permitem que esse trabalho seja concluído em questão de semanas, em comparação com os vários meses necessários anteriormente. Aparentemente, essa priorização no caso da DeepSeek faz parte de uma política implementada pelo governo chinês. Hardware e software produzidos localmente devem ter prioridade sobre os americanos. No entanto, essa notícia contradiz relatos anteriores de que a DeepSeek está usando um centro de dados secreto com aceleradores Nvidia Blackwell para treinar seu modelo de IA mais recente. Autoridades americanas acreditam que a DeepSeek tentará ocultar o uso de aceleradores da Blackwell em preparação para o lançamento do novo modelo, ao mesmo tempo que alega usar aceleradores da Huawei.
O pequeno setor de aviação elétrica atraiu um número significativo de startups, e a japonesa…
Mais de dez anos após o lançamento da primeira versão do aplicativo Telegram para Apple…
O serviço de resposta neural Alice, do Yandex, direciona, com maior frequência, para sites que…
A startup americana de veículos elétricos Rivian seguiu os passos da Tesla, oferecendo inicialmente modelos…
A ideia mais viável para viajar a outras estrelas continua sendo uma vela solar que,…
O ambicioso RPG de ação Kingdom Hearts 4, da desenvolvedora e publicadora japonesa Square Enix,…