Espera-se que o modelo de IA mais recente, DeepSeek V4, seja otimizado para aceleradores de computação chineses.

Segundo o Financial Times, esta semana a DeepSeek, empresa chinesa, deverá apresentar seu tão aguardado modelo de IA multimodal V4, otimizado para os aceleradores da Huawei e da Cambricon. Em conjunto, essas tecnologias permitirão que as empresas chinesas alcancem sucesso na implementação de tecnologias de IA sem depender excessivamente de soluções importadas.

Fonte da imagem: DeepSeek

De acordo com a fonte, o anúncio do modelo DeepSeek V4 estará ligado à sessão parlamentar na China, que começa em 4 de março. Este será o maior lançamento da DeepSeek desde janeiro do ano passado, quando o modelo de raciocínio R1 foi apresentado. Na época, alegou-se que a empresa chinesa havia criado um modelo de IA com desempenho comparável às soluções ocidentais a um custo significativamente menor. Posteriormente, foi revelado que a DeepSeek não apenas utilizou dados de modelos americanos para treinar o seu próprio, mas também dependeu de aceleradores da Nvidia, que estão sujeitos a sanções na China para os modelos que a empresa utiliza.

A otimização do DeepSeek V4 para aceleradores da Huawei e da Cambricon deverá impulsionar a demanda por essas soluções de hardware na China e reduzir a dependência de importações. Alega-se que a DeepSeek até mesmo deixou de otimizar deliberadamente seu modelo mais recente para aceleradores da Nvidia. Foi relatado anteriormente que as tentativas iniciais da DeepSeek de treinar o modelo V4 em aceleradores da Huawei não foram particularmente bem-sucedidas. Uma versão resumida do resumo do DeepSeek V4 será divulgada esta semana, mas a versão completa será publicada em cerca de um mês. A empresa americana Anthropic acusou recentemente a DeepSeek de “destilar” seus próprios modelos de IA.

admin

Compartilhar
Publicado por
admin

Postagens recentes

A Meta lançou discretamente o Pocket, um aplicativo móvel para jogos de programação com foco na experiência do usuário, para serem jogados em qualquer lugar.

A chamada programação intuitiva é usada não apenas para escrever código para projetos grandes e…

1 hora atrás

A Sony já encontrou uma nova utilidade para a fábrica onde os discos do PlayStation são produzidos.

A Sony anunciou recentemente que deixará de produzir discos ópticos com seus jogos a partir…

2 horas atrás

A Meta investiu bilhões em IA, mas Zuckerberg admitiu que os agentes demoram a ficar mais inteligentes.

O ritmo de desenvolvimento de agentes de inteligência artificial "não acelerou tanto" quanto o esperado…

2 horas atrás

Os Estados Unidos permitirão que aviões supersônicos sobrevoem cidades, mas sob uma condição.

A Administração Federal de Aviação dos EUA (FAA) anunciou recentemente sua intenção de permitir que…

2 horas atrás

“O tempo é uma construção social”: o thriller de ficção científica Ontos, dos criadores de Amnesia e Soma, foi adiado para 2027.

O thriller de ficção científica Ontos, que despertou a curiosidade dos fãs no The Game…

2 horas atrás

O blogueiro que vazou informações do iOS 26 antes do anúncio oficial culpou seu cúmplice.

O YouTuber Jon Prosser apresentou uma resposta ao processo da Apple, no qual a empresa…

2 horas atrás